経営・DXに効くAI翻訳

グローバルビジネスに応えるAI翻訳の新展開 ~ 8言語対応拡大の舞台裏と戦略~

2025.01.06

2023年の外務省調査によると160を超える国と地域に日系企業が進出しています*1。また、海外現地法人を3社以上有する日本の製造業企業では、海外生産比率・海外売上高比率共に全体の3~5割近くを占めるまでになっているという調査データもあります*2。コロナ禍や紛争などの影響を受けながらも、確実にグローバル化は進展しています。

グローバル展開する日本企業にとって、多言語対応はもはや避けて通れない課題です。さまざまな市場におけるマーケティング活動、海外スタッフとの日常的なコミュニケーション、各種マニュアルの翻訳や顧客対応など、ビジネスのありとあらゆる局面で、「言語の壁」が立ちはだかります。各国言語に長けた社員や翻訳会社に頼るばかりでは、激化する国際競争を勝ち抜くことは困難です。

みらい翻訳は、拡大するグローバルビジネスの翻訳ニーズに応えるため、2024年11月、法人向けAI自動翻訳ソリューション「FLaT」と「Mirai Translator®」に、ポーランド語、アラビア語、オランダ語、ハンガリー語、トルコ語、ミャンマー語、ノルウェー語、ヘブライ語の8言語を新たに追加しました。これにより、対応言語数は合計で20言語となりました。

今回の対応言語拡張プロジェクトを率いたPdMの鈴木氏と、プロダクト戦略全体の責任者であるCPO(最高製品責任者)の井上氏に、新言語追加の背景や今後の展望について話を聞きました。

*1 外務省「海外進出日系企業拠点数調査」より算出
https://www.mofa.go.jp/mofaj/ecm/ec/page22_003410.html 

*2 国際協力銀行「我が国製造業企業の海外事業展開に関する調査報告 -2023年度 海外直接投資アンケート結果(第35回)-」(PDF)
https://www.jbic.go.jp/ja/information/press/press-2023/image/000005619.pdf 

なぜ今、対応言語を拡大? 8言語追加の背景

みらい翻訳ブログ編集部(以下、「編集部」):今回、「FLaT」と「Mirai Translator®」の対応言語を拡充した背景を教えてください。

鈴木:「FLaT」および「Mirai Translator®」に関して、競合のAI自動翻訳サービスと比べて対応言語が少ないという状況がありました。また、顧客企業から「この言語には対応していないのか」との問い合わせをいただくことも増えてきました。そこで、顧客企業のビジネス支援と対競合戦略の観点から、対応言語の拡大が急務となったのです。

編集部:ポーランド語、アラビア語、オランダ語、ハンガリー語、トルコ語、ミャンマー語、ノルウェー語、ヘブライ語の8言語を選定した理由は何でしょうか。

鈴木:まずは顧客企業のニーズやグローバルビジネスの市場動向をもとに、対応言語の優先順位を付けていきました。さらに、候補に挙がった個々の言語に関して、技術的に対応が可能か、製品として提供できるだけの十分な翻訳精度が出せるか、というようなシステム的な観点を合わせて検討・選定しました。

言語拡張の舞台裏:AI翻訳エンジンはこうして新領域へ挑む

編集部:AI自動翻訳で対応言語を増やすとは、具体的にどのようなプロセスなのでしょうか。

鈴木:対応言語追加は、翻訳エンジンを自社運用しているかどうかで難易度が変わります。国内のAI自動翻訳サービスベンダーのほとんどは、多言語の翻訳に他社の翻訳エンジンを利用しているため、すでにそのエンジン自体が特定言語をカバーしている場合、短期間での対応が可能です。一方で精度や機能は外部エンジンに依存します。

みらい翻訳は翻訳処理を全て自社運用の環境で完結させているため、新たに対応言語を追加するとなったとき、まずは言語ごとの特性のリサーチからスタートします。リサーチをもとに要件定義を行い、文分割ルールの開発や翻訳エンジンの構築、UI実装に進むという流れです。もちろんその工程の中では、精度評価やテストを繰り返します。

編集部:「文分割ルール」とは何ですか?

鈴木:文分割ルールとは、翻訳を行う際に原文を適切な単位に分解するための基準や手法です。原文が不適切に分割されると、翻訳結果が不自然になったり、翻訳処理が非効率的になったりする可能性があります。たとえば、英語の「.(ピリオド)」は分かりやすい文分割の手掛かりですが、単純にピリオドを検出して文を区切るだけでは、「Mr.」や「e.g.」などの略語で意図せず文が分かれてしまいます。そうした誤判断を防ぐためには、より精緻なルールや処理が必要です。これはごく単純な例に過ぎませんが、実際には各言語で異なる、さまざまな特性や文法を、AIに文分割ルールとして正しく習得させるには、言語に関する深い知識と自然言語処理技術の両面からのアプローチが欠かせません。

井上:このような知識と技術を兼ね備えた専門性を有する人材がいることは、長年にわたって機械翻訳開発に取り組んできた、みらい翻訳ならではの強みだと感じています。

未知なる言語への挑戦:拡張プロジェクトの試行錯誤

編集部:今回の言語追加で特に難しかった点があれば教えてください。

鈴木:アラビア語とヘブライ語の2言語は、右から左方向に記述する言語で、みらい翻訳としてそのような言語に対応するのは初めてのことでした。ですので、私自身も開発チームのメンバーも、どのような仕様が最適かということを探り探りで進めるところもありました。

編集部:右から左に記述する言語の場合、具体的にどういった点が異なるのでしょうか?

鈴木:日本語からアラビア語に変換する場合、翻訳結果は右から左に表示されるようにしなければいけなかったり、逆にアラビア語を入力する場合に、入力した文字の表示方法はもちろん、カーソルの位置や動きも調整が必要だったりします。また、文章は右から左なんだけれど、文章中やファイルに含まれる数字、たとえば「2.0」という数字は、「0.2」を意味するわけではなく、他の言語と同じく左から右になります。そういった言語独自のルールや「普段アラビア語を使っている人にとっては、どういう挙動が正しいのか」というような点を調査し、開発に着手する前にすべて要件化する必要がありました。

編集部:なるほど。他の言語については順調に進んだのですか?

鈴木:ミャンマー語もかなり苦労した言語のひとつです。ミャンマー語に関しては、大きく2つの問題がありました。1つ目はフォントの問題です。開発前の調査で、ミャンマー語は、Unicodeフォントと民間作成のZawgyi(ゾージー)フォントの2種類が広く使用されていることが分かりました。それぞれのフォントがどのように使用されているかをさらに調べた上で、みらい翻訳として、どちらのフォントを採用して実装するべきかを検討しました。最終的には、世界的に認められていて、政府機関でも使用されているUnicodeを採用しました。

2つ目は、ファイル翻訳です。みらい翻訳では、Word/PPT/PDF/Excelなどのファイルをそのままアップロードして翻訳する機能を提供していますが、開発中のテストで、ミャンマー語のPDFファイルの解析がうまくいかないケースが多いことが判明しました。そこで、当初予定していなかったPDFファイル翻訳用の解析ライブラリのバージョンアップも実施することになったのです。

編集部:解析ライブラリとは何ですか?

鈴木:解析ライブラリとは、翻訳の前段階で文書やデータの処理を行う重要な構成要素です。ファイル翻訳においては、テキスト抽出やレイアウト情報の把握などを行います。

編集部:ファイル翻訳はテキスト翻訳以上に難しそうです。それでも同時リリースに踏み切ったのはなぜでしょう。

井上:ファイル翻訳は競合では未対応の言語も含まれており、難易度が高いことはわかっていました。ただ、ファイル翻訳とテキスト翻訳は、目的や状況によって使い分けて いただくことで、より業務効率化に貢献できるものです。企業の生産性向上を支援するには、やはりテキスト翻訳とファイル翻訳を揃えて提供することが重要と考え、今回は同時リリースにチャレンジしようと決めました。

自社運用へのこだわり:顧客企業の情報を守るために

編集部:みらい翻訳が、自社運用にこだわる理由を教えてください。

鈴木:みらい翻訳は翻訳データを国内サーバで管理しています。国内サーバでの運用は、データの所在が明確で、情報漏洩リスクを最小限に抑えることができます。海外エンジンを使う場合、データがどこの国を経由するか分からず、特定国の法規制によるデータ閲覧リスクも生じます。機密情報を扱う製造業や金融業の顧客にとって、これは大きな不安要素です。

また、自社運用ならセキュリティ上の問題が発生した場合、開発チームが直接迅速に対応できます。外部エンジンに頼れば、問題解決には提供元の対応を待たねばならず、その間お客様のビジネスが停滞する恐れもあります。全言語を自社運用で、国内で提供できていることは、非常に大きな強みに繋がると思います。

井上:ISO27001やISO27017など国際的なセキュリティ基準にも準拠し、運用体制を整えています。役割分担の明確化やバックアップ体制、トラブル時のエスカレーション手順まで整備することで、お客様は安心して当社の翻訳ソリューションを利用できる環境を手にできます。

翻訳というツールを通じて、お客様の大切な情報を守ることが、グローバルビジネスを支える上で欠かせない使命だと考えています。

8言語ローンチ後の状況と今後の遠望

編集部:8言語追加後のお客様反応はいかがでしょう。

鈴木::私自身が直接フィードバックを受け取っているわけではありませんが、カスタマーサクセスチームからは、追加した言語が実際に顧客企業で使用されているログが確認できていると聞いています。特定言語に対応要望を出してくださったお客様が新機能を活用している様子がうかがえ、非常に嬉しく思います。まだローンチから3週間ほど(※2024年11月末時点)ですので、これからの利用拡大に期待しています。

編集部:今後の課題や展望は?

鈴木:今回、条件が合わず見送った言語もあり、そうした課題を克服してさらなる言語追加を検討していく方針です。自社開発エンジンだからこそ、言語特性に合わせた拡張が可能です。ファイル翻訳においても、解析ライブラリのアップデートなどを続けながら、新たな言語の投入や機能改善を模索します。

井上:言語追加だけでなく、辞書機能の多言語対応も重要なテーマです。日英や日中だけでなく、今回追加した言語も含めて辞書対応を実現すれば、お客様にとっての利便性はさらに高まります。自社開発エンジンと体制を強化することで、こうした拡張性を高め、さらなる価値提供を目指していきます。