Alibaba Cloud Machine Translation を使ってみる #1

Alibaba Cloud による機械翻訳サービスとなる Machine Translation を使ってみました。 

1. Machine Translation の概要

Machine Translation は文字通り機械翻訳を提供するサービスです。自然言語処理技術と大規模なeコマースデータを活用し、SEOや検索、製品タイトル、製品の詳細、製品のコメント、インスタントメッセージングなど、さまざまなeコマースリンクサービスで広く使用されているとのこと。

使用のためのコストは毎月 100 万文字までは無料で利用することも可能です。

言語は以下に対応します。 

LanguageCode
Chinese /Simplified Chinesezh
Traditional Chinesezh-tw
Cantoneseyue
Englishen
Japaneseja
Koreanko
Spanishes
Frenchfr
Portuguesept
Italianit
Russianru
Arabicar
Turkishtr
Thaith
Indonesianid
Vietnamesevi
Malayms
Hebrewhe
Hindihi
Polishpl
Dutchnl
Germande

2. サービスのActivate

Alibaba Cloud のコンソールにログインします。

DTplus > Machine Translation をクリックします。

“Activate Service” をクリックします。

プロダクトに限らず Terms は必ず確認しましょう。 自分が(会社が)使う製品の提供条件を知らずに使うことは様々なリスクを伴います。 今回のMachine Translation では結果の責任は負わないことや、文字通り機械的に翻訳しているなかでコンテンツの中身の違法性などAlibaba Cloud では認識の範囲外でこちらも責任を負わないことが条件として記載されています。  SLA なども 仮に99.99% とか定義されていてもそれが成り立つ条件は各プロダクト毎に異なります。

Terms を確認するというのは Alibaba Cloud に限らず AWS でも Azure でも共通で必要なタスクですよね。クラウドに限らずオンプレミスも含めてソフトウェアやハードウェアには基本的に提供条件がある(有償でも無償のオープンソースでも)わけです。 

“Order complete” と表示されれば Activate は完了です。

3. パッケージの購入

Activate が完了後、Machine Translation の管理画面に移動します。 以下のスクリーンショットのように Overview がダッシュボードとして機能していることが確認できます。

まずは購入するパッケージを選択する必要があります。 ”Universal translation engine” は日常会話、海外旅行などが対象です。 ”Professional translation engine” は Professional 向けということで 専門用語などの充実性でも差別化が図られE-Commerce や SNS、医療分野の利用にも耐えうるとのこと。 まあ、説明文だけではなく実際に使ってみないとわからない部分はあります。

それではパッケージを購入します。

購入画面では以下のオプションの選択が必要です。

  • Resource Bundle Type
    • Universal Version of Machine Translation
    • Machine Translation E-commerce Edition (Professional translation engine)
  • Flow Pack Specificaton
    • 1 Million
    • 10 Million
    • 100 Million
    • 1 Billion
  • Specificaton Unit
    • Character
  • Length of Purchase
    • 1 Year

Resource Type は2つとも購入します。どちらとも 15 USD / year と安価なことと、 Alibaba Cloud MVP の特典として 700 USD のクーポンがあり資金に余裕があるためです。 このような時のためのクーポンとも言えますし。 

Flow Pack Specification は最低の 1 Million をまずは選択します。 4つの選択肢がありますがコストは比例します。1 Million で 15 USD / year、10 Million で 150 USD / year という感じです。

なお、購入せずとも1か月で 1 Million の API Call までは無料で使えます。 ここら辺はGoogle もそうですし他のパブリッククラウドと同じような考え方で Alibaba Cloud もサービスを提供しています。

まずは”Universal Version of Machine Translation” を購入します。

次に”Machine Translation E-commerce Edition” を購入します。

2つのパッケージの購入後の Overview は以下。 model として2つのパッケージが購入されたことを確認できます。 この時点では未使用のため Number of calls などのメトリックは 0 のままです。

4. Machine Translation のコンソール

ここで コンソールの画面を紹介します。

4.1. Overview

すでに紹介しているダッシュボードとして機能する Overview 画面です。 購入したパッケージの状況や API の Call 数を確認できます。

画像に alt 属性が指定されていません。ファイル名: image-304-1024x665.png

4.2. Dictionary Management

ここではユーザ定義の辞書を管理します。

Source と Target の言語を指定し(日本語もあります)、UTF-8 で作成したテキストファイルをアップロードします。

サンプルファイルも提供されています。中身を見ると1行に1単語の記載となるシンプルな内容です。 

4.3. Test Center

ここでは 翻訳機能をテストすることが出来ます。 そのテストのためのGUI が提供されています。

5. 動作テスト

まずは Test center から動作を確認します。

5.1. Engine > General Edition

画面画面で使われている用語が違うのでちょっとだけ混乱しますが General Edition は Uviversal Version のことです。

リストボックスから “Machine Translation Engine (General Edition)” を選択します。

2つ目はリストボックスでは翻訳する内容のジャンルを指定します。 ここでは “General” の1つしか選択出来ません。

3つ目と4つ目のリスクボックスではSource と Target の言語を指定します。14の言語を指定可能です(Target の数は Source により若干変動します)。 今回はSource に English 、Target に Japanese を指定します。

翻訳する例文は以下。 Machine Translation を紹介するホームページの文をそのまま使います。

Levering its leading natural language processing technology and massive e-commerce data, Alibaba Translate has developed a deep neural network translation (NMT) system based on the attention mechanism. At present, the system has been widely used in various e-commerce-linked services for basic data fields, including SEO, searches, product titles, product details, product comments, instant messaging, and risk control. Alibaba Translate helps resolve all language barriers for global websites and software. In addition to tiered discounts, buyers of resource packages now can invoke the system to translate 1 million characters free of charge each month.


Source Text に上の例文を張り付けし、”Translate” をクリックします。

実行後の画面です。

以下が翻訳結果ですがそれほど違和感のない日本語の文章になっています。専門用語(注意メカニズム、ディープニューラルネットワーク翻訳)は本当は英語のままの方がよかったりしますがまあこんなものでしょう。

Alibaba translateは、主要な自然言語処理技術と大規模なeコマースデータを活用して、注意メカニズムに基づいたディープニューラルネットワーク翻訳 (nmt) システムを開発しました。現在、このシステムは、seo、検索、製品タイトル、製品の詳細、製品のコメント、インスタントメッセージングなど、基本的なデータフィールドのさまざまなeコマースリンクサービスで広く使用されています。そしてリスク管理。Alibaba translateは、グローバルなwebサイトおよびソフトウェアのすべての言語障壁の解決に役立ちます。段階的な割引に加えて、リソースパッケージの購入者はシステムを呼び出して、毎月 100 万文字を無料で翻訳できるようになりました。

5.2. Engine > Professional engine

次はProfessional Engine でテストします。 

2つ目にジャンルを選びます。 今回は “Product Description”にしてみました。

翻訳します。

以下が翻訳結果です。 こちらは日本語の文章としてはかなり読みづらいものとなりました。 体言止めされている点など表現を簡略化しようとしているように見えます。  

レベリングその最先端の自然言語処理技術と大規模な電子商取引データ、アリババ翻訳開発深い神経ネットワーク翻訳 (nmt) システムベースに注意機構。現在、システムは広くさまざまな電子商取引連動サービス基本的なデータフィールド、seoなど、検索、製品タイトル、製品詳細、製品コメント、インスタントメッセージング、、とリスク制御。アリババ翻訳解決すべて言語障壁グローバルウェブサイト。またにティアード割引、リソースのバイヤーパッケージことを起動システムに翻訳各月 1 万文字の送料。

”Product Description” を他のものに変えても結果は変わらずでした。 今回の例文の場合は General が向いていることがわかりました。

6. まとめ

Alibaba Cloud が提供する 翻訳サービスとなる Machine Translation の購入と簡単なテスト方法を紹介しました。 実際の使い方としては API からの呼び出しになると思いますが翻訳の精度を確認するということであれば標準の Test Center から実施できることもわかりました。

Alibaba Cloud は Alibaba の E-Commerce のプラットフォームという特性を考えると中国語と英語、中国語と日本語のように中国語をからめた翻訳に強みがあるのではと推測します。 そういう意味では中国向けビジネスのためEC サイトなどでこのMachine Translation が効果を発揮するのかなと思います。

今回は英語→日本語のみのテストでしたが、次回は日本語→別の言語のパターンやAPI による呼び出しもテストしその内容を紹介出来ればと考えています。 本当はこのブログサイトの翻訳に使えないかも考えています。 

以上