MENU

オーディオバッファサイズの意味と最適な設定方法

DTMをしていると出てくる「オーディオバッファサイズ」この言葉の意味をわからずにいると、打ち込み途中にDAWが止まってしまうことがあります。この記事では「バッファサイズとはなにか?」「具体的な設定方法」についてテキスト+画像を使って解説しています。

バッファ(バッファー)サイズの最適の設定を知っていますか?これが適当だと演奏(録音)時に音の遅れがきになって演奏に集中できなくなります。

しかしDTM初心者にとっては「バッファって何?」って感じですよね?この記事を読むことでストレスのないDTMをするために必要なバッファサイズの知識が身につきます。

今回出てくるキーワードは次の3つ

バッファ(buffer)
レイテンシー(Latency)
サンプルレート(samplerate)

難しく考えなくても大丈夫!
画像
タップできる目次

バッファサイズとは

画像

 鉄道の車両間の衝撃を緩和する装置のことを「バッファ」といいます。いわば衝撃を逃がすためのものです。用途としてはエアーキャップ(プチプチ)もバッファーになります。

IT系ではたくさんのデータを送受信したときに処理時間や転送の速さによってタイミングが一致しない状態を補うために情報を一時的に保存できる記憶媒体や領域のことをバッファーと読んでいます。

画像

一言で言えば、データを一時溜めておく場所です。

そのサイズ(大きさ)をどれくらい取るかというのがバッファサイズの考え方になります。

イメージとしてはNetfrixやHuluなどのネット番組も常にバッファにデータが先読みされている状態です。バッファにある程度データが先読みされているおかげで、ネットの転送速度に何かしらの影響があっても再生が止まらずに映画を楽しめるわけです

画像

バッファサイズの単位はサンプルであり、

Logic Proでは16 32 64 128 256 512 1024 2048というバッファーサイズを選択できます。このあたりはDAWによっても異なります。

画像
CUBASEはかなり細かくオーディオバッファーサイズを調整できます。

バッファサイズのメリット・デメリット

バッファサイズが大きい
バッファサイズが小さい
  • VSTプラグイン等がたくさん使える
  • REC時に音の返り遅れる
  • CPU負荷が低い
  • 音が割れにくい
  • VSTプラグイン等があまり使えない
  • REC時に音の返り遅れない
  • CPU負荷が高い
  • 音が割れる

バッファサイズを大きくするとDAWなどで音が途切れることなくソフトシンセを発音させられる。つまりレイテンシーが低いということになりますが、その分CPUへの負担は大きくなります。

44.1kHzでバッファサイズを256にしたのを基本とした場合、それ以上に大きくした場合はCPUの負荷が下がりますが音のレイテンシーが発生します。この場合の遅延は次の内容に該当します。

  • MIDIキーボードの鍵盤を抑えてソフトシンセが発音するまでのライムラグ
  • パソコンにギターを取り込むためにオーディオインターフェイスを使ったときに発生するライムラグ
  • DAW経由でヘッドホンを使っているときに帰ってくるタイムラグ
  • ソフトシンセやエフェクトプラグインの使用数の増減

CPUの負荷が下がればソフトシンセやエフェクトプラグインの使用できる数が多くなるので、ミックスやマスタリング時にはバッファサイズを大きくしておくのが通例です。

バッファサイズを128より小さくすると、CPUへの負荷が高まりますが、遅延がなくなるので上記のタイムラグにおけるストレスの軽減になります。

これは「命令によるレスポンス」の速さが問われるのでリアルタイムで演奏しながら録音する人などはバッファーサイズを小さくする方が最適ですが、逆に言うと鍵盤などのリアルタイム性のない打ち込みをする場合(マウスでステップ入力も含めて)はバッファーサイズを小さくする理由はありません。

画像

マスタリングやミックスダウン時には
1024(最大)にするのがオススメ!

バッファサイズを小さいままDAW快適に動かす方法

多くのソフトシンセを立ち上げている状態ではバッファサイズを小さくするとCPUに負荷がかかるというお話をしきてまいた。44.1kHzの環境では256くらいならなんとかなると言ってもタイトなギターカッティングをする人には違和感が残る可能性もあります。こういうときはDAWのフリーズ機能を使うことでソフトシンセを擬似的にオーディオ信号化してしまうことでCPUの負荷を減らせるので、バッファーサイズを小さくできます。

フリーズ機能は以下の通り

  • CPU負荷をほぼゼロにできる
  • フリーズしたトラックはボリュームとPANのみ変更可能

フリーズを解除する場合はフリーズボタンをオフにするだけです。

仮にバッファを小さくしたままでソフトシンセやプラグインの使用数を確保したい場合はCPU負荷逃しやフリーズ機能を使うとよいでしょう。

dtm バッファサイズ で音質は変わるのか?

バッファサイズが小さいことでエフェクトプラグインやソフトシンセ等の使用時にクリップノイズなどの不快なノイズが発生することがあります。

音割れ的な意味での音質の違いはありますが、それを除いた面でのバッファサイズの違いが音質に影響を与える可能性はゼロではなくても気にする必要はないと考えます。

それをわかる耳はトップレベルのエンジニアであって、クリエイターの立場から言えば、そこを気にして良い曲がかけなくなるのは本末転倒だと思います。

バッファサイズとレイテンシーの関係性について

画像

レイテンシーとはよく「遅れる」という意味で説明されることが多いのですが、それだとDelayと同じ意味で捉えてしまう人もいるのでもう少し具体的に説明すると、レイテンシーは「待ち時間」「反応時間」が正しい使い方です。

遅延という言葉も「ただ遅れるのではなく」「理由があって長引いてしまう」というのが遅延の意味です。

会社通勤時にで電車が遅れたときにもらう「遅延証明書」は本来の到着時刻が長引いてしまうのと同じ文脈です。

レイテンシーについては次の状態で感じることができるものです。

  • MIDIキーボードの鍵盤を抑えてソフトシンセが発音するまでのライムラグ
  • パソコンにギターを取り込むためにオーディオインターフェイスを使ったときに発生するライムラグ
  • DAW経由でヘッドホンを使っているときに帰ってくるタイムラグ

これらのレイテンシーは「msec(ms:ミリセカンド)=1/1000秒」という単位で表されます。このレイテンシーを抑える役目がバッファーになります。

レイテンシーについて語られる時の多くは「音→オーディオインターフェイス入力→DAW→オーディオインターフェイス入出力」この流れに起きる再生のタイムラグがレイテンシーと言われています。

レイテンシーはオーディオインターフェイス規格等によっても変わってきます。現在最速の接続規格はThunderbolt3でUSB2.0と比較するとざっくりと83倍速いことになりますが、その速度面がそのままレイテンシーの差とはならず、オーディオインターフェイスに搭載されているエンジン等も大きく影響しています。

USB2.0Firewire800USB3.0(3.1)Thunderbolt2(3)
転送速度480Mbps800Mbps5Gbps(10Gbps)10Gbps(40Gbps)
画像
Motu 896HD Firewire800
画像
Mac mini2018内蔵インターフェイス
画像
Apogee Ensemble TB Thunderbolt2接続

サンプルレートについて

CDのクオリティが44.1kHz、最近流行りのハイレゾは96kHzです。これをサンプルレートと言います。

つまり44.1kHzの場合一秒間に44100分割してデジタル録音(記録)しています。96kHzに関しては96000回に分けてデジタル記録していることになります。この数が大きければ大きいほど俗に言う「音質がよい=アナログである」という表現します。

バッファサイズの話と合わせると44.1kHzのサンプルレートでバッファーサイズ256にするのと512にする場合バッファーサイズが大きくなればCPU負荷は小さくなりますが、遅延は大きくなります。

サンプルレートが高くなればなるほどサンプルの精度はよくなるのでその分オーディオデータの容量が大きくなります。(実際はBitについてもデータ容量は違いますが、ここではサンプルレートにだけ注目します)(ちなみに44.1kHz/16bitのCDクオリティと呼ばれるフォーマットは5分でおよそ約50MBです)

なぜ高いサンプルレートはレイテンシーが低いの?

ソフトシンセが発音するデータをバッファに記録してから出力するのが基本です。逆にバッファがなければレイテンシーは存在しませんが、その分CPUには莫大な負荷がかかります。オーディオインターフェイスや最近のDAWにはレイテンシーを自動で調整してくれる機能もあります。

「サンプルレートは高ければ高いほどクオリティが高いのなら、レイテンシーはもっと負荷がかかりそうなイメージがあるけど、なんでサンプルレートが高いとレイテンシーは低くなるの?」という疑問を持つ人がいると思います。

バッファのサンプル数は周波数で割った数値だけレイテンシーが出てきます。

つまり256÷44100=0.05804988662132つまりミリセコンドに治すと5.8msです。これを96kHzの場合は256÷96000=0.02666666666667つまり2.6msということになります。

レイテンシーは入力と出力に現れるので実際はこれの2倍〜2.5倍くらいが感じるレイテンシーになります。

最適なバッファーサイズとは?

画像

CPUスペックの低いマシンほどバッファーサイズを下げるとCPUに負荷がかかり音割れや再生不具合の原因になります。

ではどれくらいであればDTMにストレスを感じないかは人それぞれですが、最初に説明した44.1kHzで256くらいであればリアルタイム重視の打ち込みでない限りそこまでストレスを感じないでしょう。

先程の計算式でいうとこのレイテンシーは0.05秒入手力合わせるとおよそ倍の(11.6ms)になりますが、あくまでこれは計算だけの数値で実際はオーディオインターフェイスによって異なります。

音は1秒間に340m進むので11.6msの場合はざっくりと3.6mくらいの距離のスピーカーの音を聴いている印象です。タイトな演奏には向きませんがこれくらいならば演奏に耐えられるギリギリかもしれません。

まとめ

  • バッファ(データを一時溜めておく場所のことサイズはDAWによって異なるが32〜2048)
  • レイテンシー(実行命令だしてそれが実行されるまでのタイムラグ)
  • サンプルレート(1秒間に分割する数)

バッファサイズはミックスと製作時によってわけるのがベストな選択です。44.1lkHzの場合256くらいならば問題ないと書いていますが、それはあくまでリアルタイムによる入力です。リアルタイムにしないのであればバッファーの設定をそれほどシビアに考えなくてもよいです。

最近ではバッファサイズを4まで小さくできるものがあります。タイトな演奏を意識したい人にとってはほぼレイテンシーなしといえるものかもしれません

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
タップできる目次