179
エッヂの名無し
2024/10/16(水) 14:34:56.859 ID:eITO1Mzlh
あんまこう、技術の詳細まで興味ある人おらんよな
今の音声AIってRVCが出てきて岸田AIやら作られて話題になったけど企業が使ってる音声AIも基本的には仕組みはあんま変わらんと思うねん
で、RVCの学習モデルがこれ
rinnaの日本語HuBERTの特徴
・約19,000時間の日本語音声コーパスReazonSpeechを用いて学習されています。
・Hugging Faceに商用利用可能なApache-2.0 Licenseで公開されています。
ReazonSpeechコーパスは、地上波テレビ放送から収集された音声に基づいて構築されています。v1では19,000時間、v2では35,000時間の音声が含まれていて、日本語音声認識モデルの学習リソースとしては世界一の規模となっています。
どう考えても無断学習で反AIが言う基盤モデルの問題あるよな音声AIにも
これについて言及してる奴見た事ないわ
声優と合同関係の日本俳優連合も基盤モデルの無断学習に批判的だけどLORAの許可だけ取ればOKみたいな風潮あるよな声優は
今の音声AIってRVCが出てきて岸田AIやら作られて話題になったけど企業が使ってる音声AIも基本的には仕組みはあんま変わらんと思うねん
で、RVCの学習モデルがこれ
rinnaの日本語HuBERTの特徴
・約19,000時間の日本語音声コーパスReazonSpeechを用いて学習されています。
・Hugging Faceに商用利用可能なApache-2.0 Licenseで公開されています。
ReazonSpeechコーパスは、地上波テレビ放送から収集された音声に基づいて構築されています。v1では19,000時間、v2では35,000時間の音声が含まれていて、日本語音声認識モデルの学習リソースとしては世界一の規模となっています。
どう考えても無断学習で反AIが言う基盤モデルの問題あるよな音声AIにも
これについて言及してる奴見た事ないわ
声優と合同関係の日本俳優連合も基盤モデルの無断学習に批判的だけどLORAの許可だけ取ればOKみたいな風潮あるよな声優は