banner
ホームページ / ニュース / 音響研究者は音を 3 つの基本要素に正確に分解します
ニュース

音響研究者は音を 3 つの基本要素に正確に分解します

Aug 22, 2023Aug 22, 2023

2023 年 7 月 13 日

この記事は、Science X の編集プロセスとポリシーに従ってレビューされています。 編集者は、コンテンツの信頼性を確保しながら、次の属性を強調しました。

事実確認済み

信頼できる情報源

校正する

アアルト大学著

研究者たちは 200 年以上にわたり、音をその基本成分に分解する方法を探してきました。 1820 年代、フランスの科学者ジョゼフ・フーリエは、音を含むあらゆる信号は十分な数の正弦波を使用して構築できると提案しました。 これらの波は笛のように聞こえ、それぞれに独自の周波数、レベル、開始時間があり、音の基本的な構成要素です。

ただし、フルートや人間の息遣いの声など、一部のサウンドでは、元の波形を正確に模倣するために数百または数千のサインが必要になる場合があります。 これは、そのようなサウンドには、すべての周波数が同時に発生する、調和が少なく、よりノイズの多い構造が含まれているという事実から来ています。 解決策の 1 つは、サウンドを正弦波とノイズの 2 種類の成分に分割し、少数の口笛を吹く正弦波と可変ノイズ (ヒスノイズ) を組み合わせて模倣を完成させることです。

この「完全な」2 成分サウンド モデルでも、音声の子音や音楽のドラム音など、サウンド イベントの始まりの平滑化に問題があります。 トランジェントと呼ばれる 3 番目のコンポーネントは、そのようなサウンドの鋭さをモデル化するために 2000 年頃に導入されました。 トランジェントだけではクリック音のように聞こえます。 それ以来、サウンドはサイン、ノイズ、トランジェントの 3 つのコンポーネントに分類されることが多くなりました。

サイン、ノイズ、トランジェントの 3 成分モデルは、アアルト大学音響研究所の研究者によって、聴覚、ファジー ロジック、および完全な再構成からのアイデアを使用して改良されました。 彼らの研究は、Journal of the Audio Engineering Society に掲載されています。

博士研究者のレオナルド・フィエロとヴェサ・ヴァリマキ教授は、人々がさまざまな成分を聞き分け、ホイッスル、クリック音、ヒス音を区別する方法が重要であることに気づきました。 クリック音がやがて広がると、鳴り始め、ノイズが大きくなります。 対照的に、非常に短い音に焦点を当てると、調性がいくらか失われる可能性があります。

聴覚から得たこの洞察は、ファジー ロジックと結合されました。つまり、音の一部は、いつでも、サイン、トランジェント、またはノイズの 3 つのクラスの 1 つだけではなく、それぞれに属する可能性があります。 完璧な再構築を目標に、フィエロはサウンドの分解方法を最適化しました。

強化された方法では、サインとトランジェントはサウンドの 2 つの相反する特性であり、サウンドが同時に両方のクラスに属することは許可されません。 ただし、2 つの相反する成分タイプのいずれかがノイズと同時に発生する可能性があります。 したがって、ファジー論理の考え方は限定的に存在します。 ノイズはサインとトランジェントの間のあいまいなリンクとして機能し、単純なクリック音やホイッスルでは捉えられないサウンドのニュアンスをすべて表現します。 「パズルの欠けているピースを見つけて、以前は合わなかった 2 つの部分を結び付けるようなものです」とフィエロ氏は言います。

この強化された分解方法は、リスニング テストで以前の方法と比較されました。 11 人の経験豊富なリスナーに、いくつかの短い音楽を個別に聴取してもらい、異なる方法でそれらの音楽から抽出したコンポーネントを聴取させました。

この新しい方法は、リスナーの評価に基づいてほとんどの音を分解するための最良の方法として登場しました。 歌声やバイオリンなど、楽音に強いビブラートがある場合にのみ、すべての分解方法が困難となり、このような場合には以前の方法の方が優れています。

新しい分解方法のテスト ユース ケースは、サウンドの時間スケールの変更、特に音楽のスローダウンです。 これは、数年前の比較研究で最高の学術技術として選ばれた、研究室独自の以前の方法と比較して、好みのリスニングテストでテストされました。 繰り返しますが、フィエロの新しい手法は明らかな勝者でした。