[x-Music Lab 21秋] Dialect Music: 日本語方言を用いた音楽表現の研究

慶應義塾大学環境情報学部 藤井進也研究会 x-Music Lab. 2021年秋学期 最終課題 (Written by B4 渡辺 姫詩乃)

Kishino Watanabe
x-Music Lab

--

本投稿では、今学期に私が本研究会で取り組んできた卒業プロジェクト2の研究について述べる。

1. 序論

1.1 研究背景

1.1.1 日本語方言の成立と影響

方言は「一つの言語において、使用される地域の違いが生み出す、音韻・語彙・文法的な相違」(広辞苑 第 6 版)である。日本において、方言が生まれた年代は明らかにされていないが、『万葉集』に東日本方言が記載されていることから、約 1000 年以 上前には全国で方言が存在しており、交通網の発達していない近代よりも以前の人々 が出生地を離れなかったため、日本各地で言葉の地域差が生じたと推測されている (佐藤 2021)。このように日本各地で同一言語が別々に発達し、言葉の特徴に差異が 生まれることで確立された方言は、各都市の固有性を示し得る要素となった。

近代以降、標準語の確立と方言をめぐる撲滅運動を経て、方言の社会的評価が極端 に低くなったが、現代では方言と標準語が共存することでその社会的評価が高まった (小林 2004)。また小林は、方言の現代的効用として、「同一地域社会に帰属する親 しい仲間同士であることの確認」と「その場の会話を気取らない砕けたものにしたい という意思表示」を挙げている。さらに新見・丸目(2015)は、方言の効果について、「出身地の言語スタイルは共通語や他の方言よりも好意的な印象を形成する傾向」があると述べており、出身地で使われる方言に対して親しみを覚えやすいことを明らかにしている。

1.1.2 方言と芸術文化

日本では、古来より詩歌や⺠謡をはじめとする方言の音韻を生かした創作行為が盛んである。『万葉集』の『東歌』と『防人歌』は、当時の日本の政治・文化の中心で ある奈良・京都方言ではなく、東日本方言で記載されたものである(佐藤 2021)。また、『津軽じょんから節』等、多くの日本⺠謡では歌詞に方言が用いられている。

他国で方言や言葉の訛りが音楽に影響を与えた事例として、ヒップホップ音楽のラ ップが挙げられる。ラップは、1970 年代半ばにニューヨークのアフリカ系アメリカ人 居住区で生まれた(岩本 2003)。一般的なアメリカ英語とは異なるアフリカ系アメリカ人英語を用いて、ラップを作詞し、歌うことで、アフリカ系アメリカ人の歴史・文化 から得られた人権意識や抵抗の意図を彼らのみに理解できるような形で表現した(阿津坂 2016)。また、アフリカ系アメリカ人英語には地域差が存在し、東海岸のアフリ カ系アメリカ人英語のスピーチとラップは、⻄海岸のそれと比較し、それぞれリズム の多様性の程度が低く、単調であることが示唆されている(Gilbers, et al. 2020)。このよ うに、言葉の音韻は今日までに世界の芸術文化に影響を与えてきた。

現在ではインターネット上で方言を用いた歌や、方言比較動画、ローカルドラマ・ アニメ等、方言で聞き取れる特徴に着目し、それを歌や音声・映像媒体で表現する形 式のコンテンツが散見され、方言は音楽に影響し続けていると考えられる。

1.1.3 言葉の音韻と音楽技術

本節では、言葉の音韻を活用した音楽に関する技術について述べる。まず、人間の声を利用した楽器やエフェクターとして、『ボコーダー』が挙げられる。ボコーダーは一般的に、マイクを使って話しながら鍵盤を弾き、楽器音をロボットボイスのように発音して演奏される。元々は音声をより狭い帯域で送るために考案された技術であり(板倉 2006)、それが音楽に応用されたという経緯がある。その原理は、人間の発 声の仕組みに関係がある。人間は発声の際、声帯で発生する音を口や鼻で共振させている。この共振部の持つ周波数特性がフィルターとしての役割を果たすことで、多数のフォルマントを発生させている。マイク入力で声がボコーダー内を通過する際、共振部のフィルターの特徴を抽出することで人間の声のフォルマントを再現する。この ようにして再現されたフォルマントが、インストゥルメント入力で通過した楽器音と合成されることで、ロボットボイスを表現することができる。

ボコーダーとは真逆の仕組みを利用したエフェクターとして、『トーキング・モジュレーター』(別名:トーク・ボックス・モジュール)が挙げられる。トーキング・ モジュレーターは、シンセサイザーやギター等の楽器から出力された音を、チューブを通して演奏者の口内に共鳴させ、演奏者の口、舌、唇の動きによって変調させることで、その楽器が話しているかのような効果を得られるエフェクターである。

音楽制作ツールにおいて言葉の音韻が用いられた技術として、ヤマハ社の 『VOCALOID』が挙げられる。『VOCALOID』は、ソフトウェア上で作家が歌詞とメ ロディーを入力することで歌唱を作り出せる技術である。実際の歌手の歌声から取り出された音声素片を繋ぎ合わせる手法をとることで、歌声を合成している。音高変化 の緩やかさを持つ音声の性質と、音高の変化とタイミングが楽譜によって支配される という楽器の性質の両方を実現した点が特徴である(剣持 2013)。声色、ビブラート 等の歌唱表現技法、抑揚、スピード、音素の⻑さといった、歌声に関するパラメータ をユーザーが調整することもできる。

音楽制作における言葉の韻律情報に着目したツールとして、アンタレス社の『Auto-Tune』が挙げられる。『Auto-Tune』は、ボーカルのピッチ・タイミング補正エフェク トである。しかし本来の機能のみならず、音高の変化する時間を最短に設定すること により、ロボットボイスのような効果を出すことも可能である。その効果を狙ってツ ールを意図的に誤用することで、独特の歌声を表現するアーティストも存在し、現代のポピュラーミュージックの特徴的なボーカル効果のためのツールとしても選択されている。

1.1.4 先行研究

日本の芸術文化と地域性に関する先行研究として、『日本⺠謡の大規模音楽コーパ スを用いた旋律の構造抽出』(河瀬 2014)の事例が挙げられる。本先行研究では、日 本⺠謡から構築された音楽コーパスに対して、VLMC モデルを用いて旋律中の音程推 移パターンを抽出し、計量分析を施すことで、日本⺠謡の音楽的特徴と地域性を実証 した。非⻄洋音楽の日本⺠謡を対象として計量的に分析し、日本⺠謡の地域性を音組 織の違いから明らかにしている点が、過去の研究と異なっている。研究の結果、日本 ⺠謡の特徴は「近畿地方を境界に日本列島は東⻄に二分されること」と、「方言地理 学における方言の差異に関する区画と概ね一致すること」が明らかになった(河瀬 2014)。

また、言葉の音韻を作曲に応用した研究として、『対話音声の韻律情報を用いたメ ロディ生成の試み』(大野 et al. 2016)の事例が挙げられる。本先行研究では、人間同士の対話において感情表現に使われる韻律情報に着目し、映画作品の対話音声の作品 をもとに音声波形からピッチを抽出し、その周波数と継続時間から音符の音高と⻑さを求め、メロディを生成するシステムが開発された。また、そのシステムを用いて 1,000 曲のメロディを生成し、その中で良いと感じられる箇所を含む曲がどれだけ含 まれるかを主観評価することで、システムの作曲への有用性を実証した。その結果、 良いと感じられる箇所を含む曲は約 5%含まれていたほか、作曲経験者による主観評価では、作曲用の素材として使いたいと感じる曲が約半数含まれており、システムが良い曲を生成する技術として有用であることを示唆している(大野 et al. 2016)。

1.1.5 言葉の音韻を応用した音楽作品

本節では、言葉の音韻を応用した音楽作品を取り上げ、その特徴について述べる。

スティーブ・ライヒは、1995 年にマルチメディア・音楽劇作品である『The Cave』の 音源を発表した。『The Cave』は、ユダヤ教徒、イスラム教徒の共通祖先であるアブラハムが葬られた洞窟をテーマに、アブラハムとその家族にまつわる物語を描いた作品であ る。本作品の特徴は、インタビューの言葉の抑揚を楽器と歌でなぞったスピーチ・メロ ディの手法をとった点である(白石 1998)。具体的にライヒは、アメリカ人の英語とイ スラエル人とパレスチナ人の訛りのある英語を、近似的な楽音およびリズムに写し取 り、言葉のニュアンスを曖昧にし、抑揚を単純化した上で、それを素材として用いる手 法をとることで音楽を構築した。作品では、インタビューの語りと、それを平均律に変 換した物を器楽・独唱・重唱によって演奏される。母国語から英語へ、英語から楽音へ、楽音から独唱へ、独唱から重唱への変換を通じて段階的に抽象化させることで、メロディを通じた各⺠族の語りの独自の性質を、聴取者に強く印象付けることに成功した。

Steve Reich — “The Cave” — Genesis XXI (1995). https://www.youtube.com/watch?v=6WX3Kc9yeJo , (閲覧日:2021–12–21, 投稿者:dark magus | in love (2014)).

G・スコット・ヘレンによるソロ・プロジェクト Prefuse 73 は、2001 年にアルバム 『Vocal Studies + Uprock Narratives』を発表した。本作品は、全 16 曲から成るエレクトロ ニカ・ヒップホップアルバムである。本作品は、アルバム全体を通して、歌やラップの ボーカル音声を細かく切り刻むことで再構築する手法を導入した点で特徴的である。先 に述べたライヒとは異なり、Prefuse 73 は音声の楽音への変換ではなく、音声を細分化 して再構築することで、音声の持つ音階を維持しつつも、言葉の持つ意味を破壊し、無 機質なエレクトロニカ・サウンドへの昇華を試みた。本作品以前では、戦前より、楽音 以外の自然音・環境音を録音したものをカットアップして再構築する手法『ミュジーク・コンクレート』が存在した(小川 1984)。また、その手法に影響を受けて確立され た『サンプリング』は、既存音楽をカットアップする手法であり、ヒップホップを中心 に主流となっていった。しかし、本作品のように人間の歌声にフォーカスし、それをカ ットアップする手法は、リリース当時画期的であった。本作品は、『ミュジーク・コンクレート』や『サンプリング』の文脈を受け継いだ『ボーカル・チョップ』という手法を新たに提示した点で、意義深いといえよう。

Prefuse 73 — Vocal Studies + Uprock Narratives (2001) [FULL ALBUM]. https://www.youtube.com/watch?v=S2FVsp8F0Do , (閲覧日:2021–12–21, 投稿者: Torgan (2017)).

1.1.6 小括: 方言音楽の制作の目的とアプローチ

本節では、前節までに取り上げた研究背景を踏まえ、日本語方言を用いた音楽(以下、方言音楽)を制作する目的と、そのアプローチについて述べる。

これまでの「方言と芸術文化」では、日本語の方言音声をそのまま使用した音楽が存 在し、「言葉の音韻を応用した音楽作品」では、英語の方言音声を加工して制作された 音楽が存在することがわかった。また、対話音声からピッチを抽出し、メロディを生成した先行研究の事例もあった。しかし、日本語方言において、音声を加工して作られた 音楽の例は、未だかつて存在しない。そこで本研究では、日本語の方言音声を加工し、 それを素材として用いることで、『方言音楽』を新たに制作することを目的とする。

『方言音楽』の作曲過程において、方言音声を加工する方法がいくつか考えられる。 方言音声を加工せずにそのまま使用した場合は、方言の特質である音韻・語彙・文法の 全要素が残ってしまうことから、方言が音楽に溶け込まない可能性が考えられる。方言 音声をカットアップした場合は、方言の特質の三要素が全て破壊されてしまう。ゆえに、これらのアプローチは、方言音楽の作曲には不適だといえる。

方言の特質の三要素のうち、特に音韻は発話の過程で連続すると韻律となる。韻律情 報には、音の高低や強弱が含まれていることから、音楽における音高と音勢に変換しや すいと考えられる。また、方言音声を平均律音階に変換したり、抑揚を単純化したりせずに、音高と音量の連続的変化の情報を抽出すれば、方言のイントネーションにより忠実な素材を取り出せる。そのため、方言らしさを最も活かした方言音楽を制作するため には、方言の特質の三要素のうち、音韻(韻律)に着目し、音楽情報を抽出すべきである。

1.2 研究意義

本研究の意義は、日本語の方言音声の韻律情報を、音楽情報である音高および音量または音勢に変換し、それを素材として利用した『方言音楽』を制作することで、言葉の 音韻を応用した未知なる次の音楽を提示することである。

1.3 研究手法

本研究では、1.)「既存ツールを用いた方言音楽の作曲」による制作と、2.) 各方言音声の音高・音勢の連続的変化を、任意の音源に適用可能な音楽制作用エフェクト「Dialect Intonator」の開発と、エフェクトを用いた作曲をそれぞれ実践した。「既存ツールを用いた方言音楽の作曲」では、方言音声の韻律情報を平均律音階に変換する手法で、筆者が方言音楽の作曲を行なった。その結果、既存ツールを用いる手法では、方言音声のリズムやアクセントの個性は残存するが、方言音声のイントネーションの個性は残存しない傾向にあることが明らかになった。つまり、既存ツールでは、極端に大きい或いは小さいイントネーションの変化を捉えきれないことがわかったのだ。

この考察をもとに、『方言音楽』の制作に最適な創作支援システムを実現するためのオリジナル・エフェクトを開発した。具体的にそのエフ ェクトでは、音高と音量の連続的変化の情報の抽出を可能にした。開発したエフェクト を用いて筆者が方言音楽を作曲し、作曲者による作曲過程の印象をまとめた。また、リスナーに方言音楽・方言に対する印象について評価を受けた。方言音楽の制作および作曲者・リスナー評価から得られた知見をもとに、方言音楽の今後の展望について考察を行なった。

本研究の実践において、「語彙による方言区画」(橘 1936) に基づいて方言を分類した上で、音声を収集し、利用した。なお、音声の収集方法に関しては、制作手順の項目において詳しく述べる。

Fig 1. 出典: 安部 清哉, 「方言区画論と方言境界線と方言圏の比較研究」, 2015
Fig 2.「語彙による方言区画」(橘正一, 1936) の方言の分類

方言区画の方法には他にも「アクセントによる方言区画」が挙げられるが、この方言 区画では、標準語と広島弁が同じ「東京式アクセント」に該当しており、方言の言葉の地域差が出づらい印象を受け、「アクセントによる方言区画」は不適だと考えた。そのため、方言の言葉の地域差が反映された方言区画である「語彙による方言区画」(橘 1936)を本研究で用いた。

2. 研究実践 オリジナル・エフェクト《Dialect Intonator》を用いた方言音楽の作曲

2.1 作品概要

本研究において制作した『Dialect Intonator』は、DAW ソフトウェア『Ableton Live』 上のトラックで入力される任意のサウンドソースを、実際の方言音声の音の高低や強弱 から変換された音高・音勢の情報と合成することで、方言音声の韻律情報に応じた連続 的音高・音勢変化を入力ソースに適用し、『方言音楽』の制作を支援するエフェクトである。

本エフェクトでは、ピッチ抽出エフェクト等の既存ツールとは異なり、方言の韻律情 報から連続的音高・音量の変化を取り出す仕組みを導入した。これにより、平均律音階への変換や音の強弱の単純化を伴うことなく、方言の音韻の特徴を入力されるインストゥルメントに精妙に反映することが可能になる。

また、本エフェクトを用いた方言音楽の作曲を行ない、作曲者である筆者が本エフェ クトを用いた作曲の過程に関して評価するとともに、リスナーに方言音楽を聴いてもらい、それを評価してもらった。

3.2 制作手順

本エフェクト内部で用いられる方言音声は、各方言の出身者 8 名に筆者が依頼し、独自に収集したものを使用した。方言音声の収集にあたり、大学共同利用機関法人人間文化研究機構国立国語研究所と文部科学省・科学研究費特定領域研究「日本語コーパス」プロジェクトが共同で開発した『現代日本語書き言葉均衡コーパス』より標準語のフレーズを 8 種類抽出した。音声提供者に標準語の各フレーズを出身地の方言の日常表現に 翻訳してもらい、翻訳したテキストの朗読音声をスマートフォンの録音アプリで記録し てもらった。以下、方言の分類と音声提供者の 18 歳までの居住地の対応表と、使用された標準語のフレーズおよびそれらが各方言に翻訳されたものを示す。

Fig 3. 使用された標準語のフレーズ
Fig 4. 音声提供者の出身地
Fig 5. 標準語のフレーズと各方言への翻訳

システム設計には、Cycling ’74 Max 8 (Max for Live)を使用し、Ableton Live のオーディオ・エフェクトとして利用できる Max Patch を生成した。

3.3 実装

本エフェクトで実装した各機能について、以下の表に示す。

Fig. 6 Dialect Intonator の機能

上記の機能を実装し、3.2 項で収集した方言音声を本システム内部に格納した。

Fig. 7 「Dialect Intonator」の内部構成

また、作曲者であるユーザーの使用感を考慮し、以下の GUI デザインに機能をまとめた。

Fig 8. 「Dialect Intonator」エフェクトの GUI 画面

3.4 作品成果

開発した『Dialect Intonator』を用いて、各方言の方言音楽を制作した。なお、方言音楽の制作にあたり、以下のレギュレーションをあらかじめ設けた。

1. 各方言に対して、1曲制作する。2. 各方言で使う音源、エフェクトは全く同一のものとし、制作過程に差異が出ないようにする。3. 音素材は、可能な限り音程や音量が一定なものを用い、方言の音高・音量の変化を最大限に生かすこととする。4. 使用する全トラックに「Dialect Intonator」を使用する。5. 基本的に「Dialect Intonator」以外の、ピッチや音量に変化を与えるエフェクト は使用しないこととする。ただしリズムの役割を持つトラックに限り、音量の大きい箇所を強調させるための Gate や、音高変化を破壊するための Bitcrush / Erosion 等 の歪み系エフェクトを掛けても良い。

また、制作において、各方言の 8フレーズを 8トラックに分類し、以下のようなサウンドを割り当てたうえで、各トラックにおいて工夫を施した。

Fig 9. 各トラックのフレーズおよびサウンド割り当てと工夫
Fig 10. 「Dialect Intonator」を用いて作曲している様子

『Dialect Intonator』を用いて制作された方言音楽の作品成果(音源)について、以下のプレイリストに示す。

3.5 評価・省察

本項では、本エフェクトを用いて作曲した成果に対する、作曲者とリスナー各々の評価 について述べる。

まず、筆者が本エフェクトを用いて作曲をした過程での評価を述べる。本エフェクトを 通過して生成された音は、旋律が平均律音階のように確かなものではないため、その音に対して後から和音をつける作曲方法は難しいのではないかと感じた。またエフェクトによ って生成された音のリズムは、拍子や音符の⻑さ・発音タイミングによらない不規則なものであるため、すべてのトラックに本エフェクトを挿して曲を作るのは、各トラックのリ ズムが絡み合わず、苦戦した。しかし、違うフレーズのトラック同士のグルーヴや音程が 偶然上手く重なり合う瞬間を見つけた瞬間に、心地よさを感じられた。これは、エフェクトによって生成された音が、既存のツールと方言音声から生成された音と比較し、イントネーションとリズムが各方言により忠実なものとなっているからだと推察される。以上の 理由から、本エフェクトを用いて、方言の特徴を最大限に活かした音楽を制作すること で、方言の音声から生み出された複数のメロディーやリズムが「意図的に重なる」というよりも、「偶発的に嵌って行く」音楽スタイルが導き出されたと考える。

また、方言音声のフレーズが短いほど、作曲している過程でその方言の音韻の特徴を理 解しやすく、どういう入力ソースを選択すべきかを判断しやすかった。本エフェクトを改 善する際には、より短いフレーズの音声を収集し、エフェクト内で利用したい。本エフェクトの問題点として、入力ソースのアタックタイムとリリースタイムの値が 0ms に近い値 でないと、本エフェクト内部の方言音声の再生トリガーが動作しにくくなり、生成音が上手く再生されない点が挙げられる。本エフェクトを用いた方言音楽の制作においては、入 力ソースがアタックタイムとリリースタイムの値の極端に短い持続音でなければならないため、ソースを選ばざるを得ない点で、表現の幅を狭めてしまう可能性もある。

次に、12 名のリスナーに各方言音楽を 7 曲聴いてもらい、それぞれの方言音楽に対して どのような印象を受けたかについて、評価をしてもらった。以下に評価内容を一部抜粋し、示す。

Fig 11.「Dialect Intonator を用いて制作された方言音楽」リスナー評価

リスナーによる主観的な評価のため、評価内容には差が生じた。しかし、東北方言の音楽と九州方言音楽に対しては、「攻撃的」、「暴力的」な印象を受けたという声が多く挙がった。また、「方言音楽に対する親しみやすさの度合い」の評価が最も高かった近畿方言 音楽に対しては、癖や波がなく、軽快で聴きやすい印象があることがわかった。同じく 「方言音楽に対する親しみやすさの度合い」の評価が最も高かった四国方言の音楽に対しては、明るく、なめらかで、聴きやすい印象を持つ傾向にあった。ただし、入力ソースと して用いた音源が、これらの印象を招いた可能性も十分に考えられる。そのため、今後は 入力ソースの音源を比較検討しながら方言音楽を複数制作し、評価してもらう必要がある。

4. 総括

本研究では、日本語方言の音声を加工して作られた音楽作品や、日本語方言のイントネーションやリズムを活用した音楽作品の事例がこれまでに存在しない点に着目し、日本語の方言音声の韻律情報を音楽情報に変換し、それを素材として利用した『方言音楽』の制作を試みた。既存ツールを用いた方言音楽の作曲では、各方言音声のリズムの個性は残存する傾向にあったが、韻律情報の平均律音階への変換に伴い、各方言音声のメロディーの個性は残存しづらい傾向にあることが明らかになった。

方言のイントネーションに忠実な素材を取り出し、それを作曲に活用するために、オリジナル・エフェクトである『Dialect Intonator』を開発した。本エフェクトにより、方言の音韻の特徴を、作曲家が使用したい音源に反映することが可能になった。また、本エフェクトの開発により、作曲家が音楽を制作する際のエフェクトとして、「日本語の方言音声」という新たな選択肢を提示できた。そして、本エフェクトを用いることは、日本語方言の音声から生み出された複数のメロディーやリズムが、偶発的に嵌ることで音楽が構築されるという、新たな音楽表現のアプローチにもなり得ることが示唆された。このように、本研究の『方言音楽』および『Dialect Intonator』の制作を通して、言葉の音韻を応用した未知なる次の音楽と、その手法を提示することができた。

今後は本エフェクトの方言音声やシステム内部の改善を図り、システム設計に利用した Cycling ’74 Max 8 のフォーラム上で本エフェクトを公開し、普及させることを目指したい。本エフェクトが国内外問わず様々な作曲家に導入され、実際に作曲に使われることで、新たな『方言音楽』が生まれることが期待される。例えば、今回の研究では扱われなかった方言で『方言音楽』が作られたり、会話における方言の効果である「親しみやすさ」を『方言音楽』においても実現可能かどうかが研究されたりする可能性もある。「方言と芸術文化」や、「言葉の音韻と音楽(音楽技術)」の領域の真価や可能性を探究すべく、『Dialect Intonator』のアップデートと、『方言音楽』の制作を続けていきたい。

謝辞

本プロジェクトのメンターを務めていただきました、環境情報学部 藤井進也准教授に心から感謝いたします。研究の制作・発表の場を設けてくださり、沢山のフィードバックを頂いたことで、本研究を進めることができました。また、私のエキセントリックな研究に対し、「めっちゃおもろいやん!」と言ってくださり、温かく見守ってくださったことは、研究活動を進めるうえで大きな励みになりました。

音楽・メディアアートの観点から本研究をご指導いただきました、政策・メディア研究科 魚住勇太特任講師、田中堅大研究員に深く感謝いたします。研究者兼音楽家として活動されているお二方の存在は、音楽制作の研究に取り組んだ私にとって、大変心強かったです。

2年間、共に制作・議論しながら研究を行なってきた、藤井進也研究会 x-Music の皆様にも感謝いたします。今後の皆様のご活躍をお祈りしております。

本研究でエフェクトを制作するにあたり、方言音声の提供にご協力いただきました7名の被験者の皆様、この場を借りて改めて御礼申し上げます。

そして、私の大学生活を応援してくれた家族に、心から感謝します。母と弟の支えなしでは、本研究を成し遂げられなかったと思います。ありがとうございました。

私はSFCおよびx-Musicを離れてしまいますが、これからも音楽家として「未知なる次の音楽」を探求すべく、制作活動を展開していきます。

参考文献

--

--