====================================================================== Large Vocabulary Continuous Speech Recognition Engine Julius (Rev 4.3.1 2014/01/15) (Rev 4.3 2013/12/25) (Rev 4.2.3 2013/06/30) (Rev 4.2.2 2012/08/01) (Rev 4.2.1 2011/12/25) (Rev 4.2 2011/05/01) (Rev 4.1.5 2010/06/04) (Rev 4.1 2008/10/03) (Rev 4.0.2 2008/05/27) (Rev 4.0 2007/12/19) (Rev 3.5.3 2006/12/29) (Rev 3.4.2 2004/04/30) (Rev 2.0 1999/02/20) (Rev 1.0 1998/02/20) Copyright (c) 1991-2013 京都大学 河原研究室 Copyright (c) 1997-2000 情報処理振興事業協会(IPA) Copyright (c) 2000-2005 奈良先端科学技術大学院大学 鹿野研究室 Copyright (c) 2005-2013 名古屋工業大学 Julius開発チーム All rights reserved ====================================================================== Julius について ================= Julius は,音声認識システムの開発・研究のためのオープンソースの高性能 な汎用大語彙連続音声認識エンジンです.数万語彙の連続音声認識を一般のPC 上でほぼ実時間で実行できます.また,高い汎用性を持ち,発音辞書や言語モ デル・音響モデルなどの音声認識の各モジュールを組み替えることで,様々な 幅広い用途に応用できます. 動作プラットフォームは Linux, Windows, その他 Unix 環境です.詳細・関連情報は以下の URL をご覧下さい. http://julius.sourceforge.jp/ Julius-4.3 ============= バージョン 4.3 では、DNN-HMM (Deep Neural-Network HMM) を用いたオンライ ンデコーディングのための機能が追加されました。具体的には、状態出力確率 ベクトル"outprob vector" を入力としたデコーディング、ネットワーク経由の 特徴量ベクトル(および状態出力確率ベクトル)入力のサポート、リアルタイ ムのための CVN (cepstral variance normalization), フィルタバンクベース の特徴量(FBANK/MELSPEC)のサポートです。また、ツール adintool に特徴量 を抽出してネットワークへリアルタイム送信する機能が追加されました。 新オプション: [-input vecnet] ネットワークから特徴量/出力確率ベクトルを読み込む [-input outprob] HTKパラメータファイルを出力確率ベクトルとして読み込む [-outprobout [file]] 計算された出力確率行列をHTK形式ファイルに保存(debug) ネットワークの特徴量ベクトル送受信は、例えば以下のように試すことができます: [サーバ] % julius -C file.jconf -input vecnet [クライアント(マイク付き)] % adintool -in mic -out vecnet -paramtype MFCC_E_D_N_Z -veclen 25 -C file.jconf adintool には、特徴量ベクトルのタイプ ("-paramtype TYPE") と総次元数 ("-veclen length")を必ず指定する必要があります。また、特徴量抽出条件 は Julius使用時と同様にJuliusと同じオプションを用いて指定します。 adintool は Julius のライブラリを用いており Jconf ファイルを読み込めま すので、Julius 単体で認識が動作するときの Jconf ファイルをそのまま adintool に "-C" で与えるのがよいでしょう。(上記の例) 変更点の詳細な一覧は Release-ja.txt をご覧ください. また "-help" をつけて実行することでオプションの全リストが出力されます。 ファイルの構成 =============== 00readme-ja.txt 最初に読む文書(このファイル) LICENSE.txt ライセンス条項 Release-ja.txt リリースノート/変更履歴 configure configureスクリプト configure.in Sample.jconf jconf 設定ファイルサンプル julius/ Julius ソース libjulius/ JuliusLib コアエンジンライブラリ ソース libsent/ JuliusLib 汎用ライブラリ ソース adinrec/ 録音ツール adinrec adintool/ 音声録音/送受信ツール adintool generate-ngram/ N-gram文生成ツール gramtools/ 文法作成ツール群 jcontrol/ サンプルネットワーククライアント jcontrol mkbingram/ バイナリN-gram作成ツール mkbingram mkbinhmm/ バイナリHMM作成ツール mkbinhmm mkgshmm/ GMS用音響モデル変換ツール mkgshmm mkss/ ノイズ平均スペクトル算出ツール mkss jclient-perl/ A simple perl version of module mode client plugin/ プラグインソースコードのサンプルと仕様文書 man/ マニュアル類 support/ 開発用スクリプト (new) dnntools/ Sample programs for dnn and vecnet client 使用方法・ドキュメント ======================= 本アーカイブに付属しているのはソースコード,バージョン遍歴,サンプルの jconf 設定ファイルおよび各種オンラインマニュアル(.man)のみです. ドキュメントの多くは JuliusBook に統合されました。JuliusBook を含め、 多くのドキュメントは Julius の Web ページにて最新版を見ることができま す.すべてのオプションの説明やコンパイル方法,チュートリアルから様々な 使用方法,各機能の紹介,制限事項等の資料がありますので,そちらを御覧下 さい. ホームページ:http://julius.sourceforge.jp/ また,上記ホームページにおいて,Juliusを用いた研究やアプリケーション開 発に関する情報交換を行うための「開発者フォーラム」を設置しております. 最新の Julius の CVS 更新情報なども投稿されます. どうぞアクセスください. Julius Forum: http://julius.sourceforge.jp/forum/ ライセンス =========== Julius はオープンソースソフトウェアです. 学術用途・商用を含め,利用に関して特に制限はありません. 利用許諾については,同梱の文書 "LICENSE.txt" をお読み下さい. また以下のファイルやディレクトリ内の Copyright もご参照下さい。 gramtools/gram2sapixml/gram2sapixml.pl.in libsent/src/wav2mfcc/wav2mfcc-*.c libsent/src/adin/pa/ msvc/portaudio/ msvc/zlib/ 連絡先 =========== Julius に関するご質問・お問い合わせは,上記Webページ上のフォーラム, あるいは下記のメールアドレスまでお問い合わせ下さい ('at' を '@' に読み替えてください) julius-info at lists.sourceforge.jp 以上