新庄で祭礼、平穏願う優しい光 高校生手作りの絵灯籠
口の動きだけで言葉を認識し、違う声にする究極のバ美肉技術のための研究資金をクラウドファンディング中」という記事で取り上げたデータベースで、東北イタコの歌唱データベース制作のクラウドファンディングのストレッチゴールとして登場したもの。 ITAコーパス マルチモーダルデータベースとして研究者向けに公開されている( ) 簡単にいうと、声優さんが喋る言葉を録音するとともに、それに音素ラベルを付けてデータベース化を行う一方、その喋るところをビデオ撮影し、唇(くちびる)の動きも一緒にデータベース化したものです。目的は読唇術をシステム的に実現することで、カメラで捉えた唇の動きを元に音声合成ができる研究を進めよう、というものでした。 今回公開されたVOICEVOXはそのITAコーパスのデータベースの中の唇の動きは一旦無視し、音声データベースだけを取り出してディープラーニングさせて音声合成システムとして仕上げたものとなっています。以下からダウンロードできるので、ぜひ、試してみてください。 Windowsの実行ファイルとなっており、ZIPファイルを展開した上で、適当なフォルダにコピーしてVOICEVOX.
- ポン酢の爽やかさにバターのコクがたまらない! 〜市瀬悦子さんの糖質オフおかず「鶏とズッキーニのバタポン炒め」 | 暮らしとおしゃれの編集室
- 『モンスト』-「Dr.STONE」コラボ開催予定!「石神千空」「クロム」「獅子王司」「あさぎりゲン」などが登場 - Boom App Games
ポン酢の爽やかさにバターのコクがたまらない! 〜市瀬悦子さんの糖質オフおかず「鶏とズッキーニのバタポン炒め」 | 暮らしとおしゃれの編集室
暑い日が続きますね オホーツクは昨日史上最高気温の36. 7度になりました そんな中、首にアイスノンして外仕事をしていましたが 危険を感じて早々に引き上げました 今日も暑い予報なので 外のお仕事は諦めて お野菜の大量消費をしていました 【胡瓜のパリパリ漬け】 (レシピはネットからお借りしました) 【材料】 胡瓜 1kg 塩 10g 醤油 50cc きび砂糖 50g(砂糖可) 酢 70cc みりん 20cc 生姜 30g 塩昆布 40g 胡瓜1cm弱の輪切りに 塩を混ぜて 20分くらいおきます 塩昆布以外の材料 を 3分の1くらいに煮詰めます 軽く水気を切った胡瓜と 塩昆布を入れてササッと混ぜます ※混ぜすぎたり煮過ぎたりすると パリパリ感が無くなるので注意 1日冷蔵庫で寝かせました 冷凍します 解凍して少しずつ食べます 解凍後もパリパリです ズッキーニとナスは オリーブオイルで素揚げして 冷凍しました ※クッキングシートに並べて冷凍すると パラパラに これを更にジップロック等に入れて冷凍しておくと 冬の貴重なお野菜になります 最高33. ポン酢の爽やかさにバターのコクがたまらない! 〜市瀬悦子さんの糖質オフおかず「鶏とズッキーニのバタポン炒め」 | 暮らしとおしゃれの編集室. 4℃ 最低20. 6℃・現在31. 7℃ お散歩に行けないウォ~ン🐾!
『モンスト』-「Dr.Stone」コラボ開催予定!「石神千空」「クロム」「獅子王司」「あさぎりゲン」などが登場 - Boom App Games
営業力と宣伝力を背景に、北海道No.
と思ったのが、VOICEVOXの開発を始めたきっかけです。 VOICEVOXを開発した、ヒロシバさん --そのキャラクターの声の元素材として、先日公開されたITAコーパスが使われたわけですね。改めてITAコーパス制作の経緯を教えてもらえますか? 小田: 昨年、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングを行った際、そのストレッチゴールとしてITAコーパス読唇データベースを作るということになり、261%という達成をすることができました。いろいろと苦労はあったのですが、みなさんのご協力をいただき、データベースを完成させることができ、先日6月12日に公開したのです。現在、いろいろな研究者の方がこのデータベースをダウンロードして、使っていただいていますが、その中で、いち早く連絡いただいたのが、ヒロシバさんでした。いろいろなやり取りをした結果、オープンソースとして公開するという形になったのです。 SSS合同会社の小田恭央さん --ITコーパスには東北イタコ、四国めたん、ずんだもんの3つがありますが、このうちの四国めたんとずんだもんのデータをディープラーニングで学習してモデルを作ったということなのでしょうか? ヒロシバ: そうです。ITAコーパスでは各々のキャラクターで十分な音声データ量と、人による正確な音素ラベルがセットで配布されており、そのままディープラーニングの学習データとして活用できました。アクセントやイントネーション、音素長をユーザーが調整できるようにしたかったので、最近ディープラーニング界で流行りのEnd-to-Endモデルを使わず、自作のモデルを使って工夫をしています。 四国めたんのキャラクタ --非常になめらかな喋りで驚きます。ところで今回オープンソースでの公開となっていますが、単にフリーウェアとして無料で配布というのと、オープンソースでの公開というのは、どんな意味合いの違いが出てくるのでしょうか? 小田: いろいろな違いがあると思います。すでに無料で利用できるTTS(Text To Speech:喋る音声合成ソフト)は存在していますが、オープンソースにしたことで、システムに組み込むことが可能となるのが大きな違いです。Windowsサーバーなどに組み込んでおけばネット経由で喋らせることもできるし、ロボットなどに組み込むといったことも可能になります。しかも四国めたん、ずんだもんの声を使う場合、クレジットに「Voice:四国めたん」「Voice:ずんだもん」と記載すれば商用でも非商用でも申請無しで無料で使用することができるようにしたので、さまざまな応用ができるはずだ、と考えています。 ずんだもんのキャラクタ --利用マシンをWindowsに限定すると、少し制約が出るかもしれませんが、このVOICEVOXはMacやAndroid、またLinuxなど、ほかのOSに持っていくことは容易にできるものなのでしょうか?