Yuichiro_S の Twitterでは文字数が足りないもの

Twitterに書くには向いてないことを書きます。文字数制限だとか、検索に引っかからないだとか、流れてしまって読んでもらえないだとか。

Audacityで “クリッピングを表示” “Show Clipping” オプションを使って音割れを判断している方へ

この記事を書いた理由

近年(おそらく2013年くらい)音割れ音源が増えすぎて、誰もが音割れを気にするようになった。
しかし、無料で高機能なために手軽に波形を見たりするのに使われるAudacityは、何も知らないと使い方があんまり分からない。
とりあえずググッて出てくるセンセーショナルで悲惨な例に倣い、見様見真似で使って、結果的にアーティストを中傷することになってしまったり、逆に、自分の耳がおかしいのではないかと疑って音楽が楽しめない、などということになったりする。

また、音割れ音源が増える前は、いわゆる海苔音源が問題視されていたため、混同されることが多い。

そのあたりを整理したかったので、これを書いている。

音割れを判断する根拠として、クリッピングを表示オプションを使うのは間違いである。クリッピングを検出コマンドを使うべきである。

2015/10/06 21:13 追記:0dBに張り付いていなければクリッピングを検出コマンドでは検出できないので、検出されない音割れはあります。
例えば、下記の音割れの例の音源に対して、音量が下がるような加工(イコライジング等を含む)を加えると、実際には音割れはあるにも関わらず、検出されなくなります。
音割れの存在は検知できますが、音割れがないことは検知できません。

音割れとは

言葉の説明

ここで言う音割れとは、記録されている音声が、0dBを「超えて」「音の情報が失われて」いるものを指す。これはデジタル音声フォーマットにおいてはそこそこ一般的な定義だと思う。
ここで出す例と説明はまったく厳密でないです。

例1

440Hzのサイン波を
f:id:Yuichiro_S:20151006194904p:plain
音量を上げて音割れさせると
f:id:Yuichiro_S:20151006194914p:plain
のようになる。
元の音とは明らかに違う音だろうなーくらいに思ってほしい。

例2

440Hzのサイン波に4400Hzのサイン波を足した音声
f:id:Yuichiro_S:20151006194327p:plain
の一部の音量を上げて音割れさせると
f:id:Yuichiro_S:20151006194331p:plain
のようになる。
4400Hzの情報が失われてるなーくらいに思ってほしい。

クリッピングを表示とは そしてそれにまつわる誤解

クリッピングを表示という機能の説明

0dBに届いているところを赤く表示しているだけである。

なんでこんな機能があるのかというと、古きよき音源においては、音量が最大の場所でも-0.9dBとかの余裕をもって制作することがほとんどだったので、0dBに張り付いてるというのは異常なことで、音割れの目安として使えたのである。音圧を上げるということが(いわゆる音圧競争と呼ばれるマーケティング的な意味だけでなく、音楽の表現のかたちとして)一般的になった現代においては、あんまり役に立たなくなった。

クリッピングを表示機能を使うと真っ赤だけど音割れしていない例

f:id:Yuichiro_S:20151006192406p:plain
音量0dBのサイン波を生成すると、音量0dBなので、当然クリッピングを表示機能に検知され、
f:id:Yuichiro_S:20151006192414p:plain
真っ赤になる。しかし、実際は
f:id:Yuichiro_S:20151006192417p:plain
音声に問題はない。

クリッピングを表示機能を使うと大して赤くないけれども音割れはしている例

f:id:Yuichiro_S:20151006192422p:plain
振幅0.9のサイン波を生成して、一部の音量を上げると
f:id:Yuichiro_S:20151006192425p:plain
大して赤くはないが
f:id:Yuichiro_S:20151006192428p:plain
思い切り音割れしている。
こういうのを検出するために、クリッピングを検出というコマンドがあり、
f:id:Yuichiro_S:20151006192431p:plain
こういうふうに検出して表示してくれる。

そんな単純な例だと納得できないという方へ

当然だと思うんですけど、あんまり「この曲音割れてるぜ!」と書くと、気付かないで楽しんでいる方に悪いと思っていて、無難な曲を選ぶのが面倒くさくなりました。バラードっぽい曲で割れてると言われているものと、いわゆるEDMあたりを比較すると分かりやすいと思います。

最後に

この部分の記述はおかしいだろう、という部分があったらコメントなりTwitterでメンションなどください。 音がひどくてつらいのはもちろんなんですけど、音割れ音源でスピーカのツイータが焼けたら、誰が責任取ってくれるんでしょう…… 海苔音源と音割れ音源が混同されることについての説明は省きました。

おまけ

上であげた例の、440Hzサイン波の、音割れ前後のスペクトル
f:id:Yuichiro_S:20151006201341p:plainf:id:Yuichiro_S:20151006194917p:plain

上であげた例の、440Hzサイン波+4400Hzサイン波の音声の音割れ前後の、スペクトル f:id:Yuichiro_S:20151006201338p:plainf:id:Yuichiro_S:20151006201335p:plain

矩形波みたいな感じです。