arcanum_jp’s blog

おっさんの日記

voicevoxをgithubからクローンして起動してみました

また衝撃的なのがずん子さん関係で出てしまいましたね・・・

voicevox.hiroshiba.jp


ダウンロードして実行するとこんな感じのUIで遊ぶ事ができるみたいですね。四国めたんちゃんの声が落ち着いて可愛い限りです。
f:id:arcanum_jp:20210804184056p:plain

こんな感じでダウンロードしたファイルを解凍して実行しました。

c:\temp
     +--VOICEVOX-0.1.1-win
                 +-- VOICEVOX.exe    <-- これを実行する。

気になったのがずん子さん公式のこのツイートで、サーバーで起動することができるとな?そうするとUIはAndroidとかiPhoneタブレットなどで表示してサーバーで声を生成してストリーミングで聴かせるなんてことができるのかな?

んでその疑問を解決するためアマゾンに、、いやvoicevoxのサイトに表示されてるgithubに行ってみました。という事でこのエントリはgithubのWebアプリの起動方法までです。

ギッハブからクローンして起動まで

voicevoxのgithubは公式でも書いてますがこちらです。
github.com


こちらからコマンドプロンプトを開き適当な場所で(自分の場合はc:\tempで)ソースをクローンします。

git clone https://github.com/Hiroshiba/voicevox.git

これでc:\temp\voicevox というディレクトリにソースがクローンされるのでそのディレクトリに移ります。

c:\temp
     +--VOICEVOX-0.1.1-win
     |           +-- VOICEVOX.exe 
    +--voicevox                 <-- ここにクローンされる

まず、npmによる依存関係のインストールが必要です。

C:\temp\voicevox>npm install


なんか盛大にWARNが出ますが気にしない。とりあえず進めましょう。

先程クローンしたc:\temp\voicevox に .env というファイルがありますのでこれを開いてVOICEBOXエンジンへのパスを記載します。

VOICEBOXエンジンとは?

実はさきほどgithubからクローンしたのはUI部分で、実際の声を生成する部分は別になっている模様です。
githubはこちら。
github.com

この先ほどクローンしたプロジェクトからエンジンに命令を送ってボイスを作るようです。
但し、2021/08/04時点でまだ未整備事項があるらしく、これを正しく起動することはできません。
じゃぁどうするかというと、冒頭で表示したUIのエンジンを使います。

README.mdfに書いてありますが、クローンしたディレクトリに.env.productionというファイルがあります。
これを.envにリネームして開いてみます。

c:\temp
     +--VOICEVOX-0.1.1-win
     |           +-- VOICEVOX.exe 
    +--voicevox
                 +--.env.production      <-- このファイルをリネームしてエディタで開く


こんな感じになっていますね。

ENGINE_PATH=run.exe
VUE_APP_ENGINE_URL=http://127.0.0.1:50021

このrun.exeですがこれがVOICEBOXエンジンのようです。なのでこれへのパスを書いてあげるという事になります。

c:\temp
     +--VOICEVOX-0.1.1-win
     |           +-- run.exe       <-- これがエンジンっぽい
    +--voicevox
                 +--.env.production 

僕の場合はc:\temp\VOICEVOX-0.1.1-win\ にダウンロードしたファイルを解凍したのでこんな感じになります。

ENGINE_PATH=C:\temp\VOICEVOX-0.1.1-win\run.exe
VUE_APP_ENGINE_URL=http://127.0.0.1:50021

アプリを実行する

この上でアプリを実行してみます。

C:\temp\voicevox>npm run electron:serve

Windowsによってはこんな画面が出てきますが[アクセスを許可する]を押します。
f:id:arcanum_jp:20210804185950p:plain

するとこんな感じで表示されます。
f:id:arcanum_jp:20210804204005p:plain

先程のrun.exeをエンジンとして起動するにはWindowsサーバーになってしまいますが、多分Linuxサーバーとかで起動するにはVOICEBOXのgithubプロジェクトを正しくビルドする必要があるのでしょう。
あれ?キャラクターのアイコンがうまく表示されない・・・なんでだろ?という疑問はありつつ起動できたので一旦ここでおしまい。