Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

full_context_label.rsのPhonemeをメンテナンスしやすい形にする #216

Closed
qwerty2501 opened this issue Aug 6, 2022 · 2 comments

Comments

@qwerty2501
Copy link
Contributor

qwerty2501 commented Aug 6, 2022

内容

https://github.com/VOICEVOX/voicevox_core/blob/main/crates/voicevox_core/src/engine/full_context_label.rs#L24-L82 の Phonemeが現在HashMapでデータを持っており、またそのkey名が 何を指しているかわかりにくい (p3やf1といったものを初見の人が見て意味がわかるかというと多分Noなので・・・)
そこで open_jtalk のドキュメントを読み込み、それらの短いkeyが何を指しているか調べ、それを元に適切なfield名に変更する
必要ならrustdocなどで補足説明を記載する
またHashMapはアクセスする際にパフォーマンスが悪いので他のstructと同様にfieldにする。
さらに数値にできそうなfieldについては文字列ではなく数値にする

Pros

  • field名がわかりやすくなりメンテしやすくなる
  • struct field化することにより実行時のパフォーマンスが向上する

Cons

ないはず

その他

@Hiroshiba まえに教えてもらったopen_jtalkのドキュメントへのリンク、ちょっと今出てこないのでもし知ってたらリンク貼ってもらえると助かります

@Hiroshiba
Copy link
Member

たぶんopenjtalkではなく、HTSのフルコンテキストラベルのドキュメントだと思います!
引っ張ってきました、こちらです。

HTSのページからダウンロードできる配布物の中にフォーマットが書かれてます。
http://hts.sp.nitech.ac.jp/?DownloadHTS-2.3Japanese tar.bz2 (126 MB)をダウンロードして、data/lab_format.pdfを見るとリストが見つかります。

@qryxip
Copy link
Member

qryxip commented Mar 24, 2024

#742 により解決。

@qryxip qryxip closed this as completed Mar 24, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants