投稿

方言の想起

「(target word)が書いてある。」 例えば、北関東方言では「行く」が「いぐ」となる場合がある。 湘南方言では「行く」は「いくべ」と表現される。これは「Let’s go」、「Do you want to go?」、「I go」の意味合いを含む。個人的な湘南方言の経験は横浜市内の高校におけるものであり、方言はあまり使われておらず、「いくべ」くらいしか聞かれなかった。そのため湘南方言の話者(横浜出身)は、キャリアセンテンスを使用する際、東京方言で話すと考えられる。 北関東における調査結果によれば、target wordにおいて大きなアクセントの違いは見つからなかった。しかし、北関東に在住した経験からすると、若い世代も方言を使用、もしくは標準語を用いていないことがわかる。従って、carrier sentenceを用いた調査は、方言の収集に十分ではない可能性がある。

Juliusによる音素セグメンテーションをmacOS 14.0で行う

イメージ
大量の音声データの子音・母音をアノテーションする必要があったのでJuliusを試してみることにしました。今のところはPraatで手動でタグ付けしています。 まずJuliusの導入ですが、ドキュメントが散在していてわかりにくいですね。 現在Juliusのコードやドキュメントは https://github.com/julius-speech/julius  にあります。OSDNやSorceForge.jpにあるものはリンク切れのようです。 今回は音素セグメンテーションということでSpeech Segmentation Toolkit  https://github.com/julius-speech/segmentation-kit  を使います。 1. Homebrew経由でJuliusのインストール Homebrewは /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" でインストールします。 Juliusは brew install julius でインストールします。ここで whereis julius  でjuliusがインストールされた場所を確認します。  私の環境では /opt/homebrew/bin/julius にインストールされました。 2. SegmentationToolkitのダウンロード git clone https://github.com/julius-speech/segmentation-kit.git で任意のディレクトリにcloneします。 そしてsegment_julius.plを修正します。 52行目の $juliusbin="./bin/julius-4.3.1"; を $juliusbin="/opt/homebrew/bin/julius"; に変更します。 これで用意ができました。 ここで注意が必要なのはJuliusは音声ファイルが16kHzモノラルにする必要があります。そしてJuliusの出力するセグメンテーションファイルは.labファイルです。そこで  https://github.com/Syuparn...