増えるオンライン会議の強い味方、トランスクリプトとは?

2022.08.232022.11.17

テレワークが推進されてから、「気軽に集まれるせいか、オンライン会議が増えた」という声を耳にします。そのため議事録の作成量が増えたり、作成スピードを求められたりとお困りの会議担当者も多いようです。そこで、議事録作成の時間短縮に役立つ「トランスクリプト」をご紹介します。

「トランスクリプト」という言葉の意味を知ろう

最近ビジネスシーンで「トランスクリプト」という言葉を見聞きすることが多くなった、と感じている方が増えています。そこでまずは、「トランスクリプト」という言葉の意味から見てみましょう。

トランスクリプトとは

「トランスクリプト(Transcript)」とは、英語で「講演やインタビューなどの筆記録」や「文書や記録などの写し」を意味します。そこから派生して、卒業した学校の英文成績証明書という意味でも使われます。ビジネスシーンで使われるトランスクリプトは、「話された内容を文字に書き起こす」ことを指します。

「話された内容を文字に書き起こす」というと「テープ起こし」を思い起こす方もいると思います。現在「テープ起こし」は、録音された音声のみならずオンライン会議などの映像の音声からも文字を書き起こすので、「テープ起こし」とトランスクリプトは同義といえます。

違いは、「テープ起こし」は日本でのみ通用する言葉ですが、トランスクリプトは、これからご紹介するような機能の名称にも使われ、その機能が急速に発展しつつあることから、世界中で通用する言葉だという点です。

ビジネスシーンに「トランスクリプト」が続々登場

2020年ごろから、AI(人工知能)技術を利用して音声を自動的に文字にする「トランスクリプト機能」が、ビジネス系アプリケーションに次々と付加されるようになりました。そのいくつかをご紹介しましょう。

Microsoft Word

Microsoft 365のデスクトップ版Wordには以前から、音声入力で文字を書く「ディクテーション機能」があります。対応が遅れていた日本語での入力も、2020年秋ごろから始まりました。さらにブラウザ上で利用するWeb版Word(Word Online)にはディクテーション機能の他に、録音した音声データから自動で文字を起こす「トランスクリプト機能」が加わり、2021年には日本語でも使えるようになりました。

Microsoft Stream

企業向け動画共有サービスMicrosoft Streamには、アップロードされた動画の音声から自動で字幕を作成できる「キャプション機能」があります。2021年には日本語に対応するようになり、動画の音声内容が自動で文字化される「トランスクリプト」が付加されたことで、ある言葉が発せられた時間や場面を容易に検索できるようになりました。

Microsoft Teams

オンライン会議で企業がよく利用するMicrosoft Teamsには2021年、ライブトランスクリプト機能が加わりました。Teams内でやり取りしている内容がリアルタイムで文字起こしされる機能で、日本語にも対応しています。

Zoom

Microsoft Teamsと並んでよく利用されるオンライン会議ツールZoomでも、有料版に搭載されていた字幕表示機能「ライブトランスクリプト」が、2021年秋から無料アカウントでも利用できるようになるそうです。

トランスクリプト機能がついたビジネスアプリを紹介!

こういったトランスクリプト機能は、AIや音声認識の技術が向上したことで実現していますが、どれくらいの精度があるのでしょうか。筆者が参加した会議の音声データを使って、Word Onlineのトランスクリプト機能を試してみました。

操作は以下のようにとても簡単でした。
1.Word Onlineで新規の文書を開く
2.「ディクテーション」メニューから「トランスクリプト」を選択する
3.ドキュメントの右横に「音声をアップロード」と「録音を開始」のボタンが現れるので、「音声をアップロード」から音声データをアップロード
4.データを読み込み終えると瞬時に、トランスクリプトがタイムスタンプ(発言した時間)や話者ごとに分かれて表示される

音声データを人がテープ起こししたテキストと、トランスクリプト機能で生成されたテキストを比べてみましょう。

人がテープ起こししたテキスト

司会者:それでは、えー、戦略会議を始めたいと思います。えっと、本日の議題は、えー、この資料の上から3行目にありますジゴンプロジェクトのウェブ構築にあたって、UIの設計をどのようにするかというような内容になります。えっと、システム編集部の加藤さん、あの、発表をお願いします。
加藤:はい、加藤です。おはようございます。

Word Onlineのトランスクリプト機能で生成されたテキスト

00:00:00 話者1 それでは。
00:00:02 話者1 ええ戦略会議を始めたいと思います。えっと本日の議題は、この資料のええと上からさん行目にあります。
00:00:12 話者1 ええ自分のプロジェクトのweb構築にあたって、uiの設計をどのようにするかというような内容になります。
00:00:21 話者1 とシステム編集部の加藤さんあの発表お願いします。
00:00:27 はい。佐藤です。おはようございます。

固有名詞の聞き取りは苦手なようですが、トランスクリプト機能は想像した以上に精度が高いと感じ、議事録作成をおおいに手助けしてくれそうです。一方、発言録を作成するといった場合には物足りない印象。それでも、音声の内容をテキストで検索できる資料として、例えば重要な言葉を聞き直ししたい時などに役立ちそうです。

トランスクリプトを利用した事業化も進んでいる

トランスクリプト機能を作業効率のために利用するだけでなく、サービスや商品の開発といった事業化の手段として利用する企業も増えています。

トランスクリプトを活用した事業例

日本取引所グループJPXでは、海外企業の決算説明会などでの音声を書き起こし翻訳した情報を提供する「イベントトランススクリプト提供サービス」を有料で行っています。
参考:日本取引所グループ
ソースネクストのボイスレコーダー「AutoMemo」では、録音した音声データをクラウドにアップロードすることで、専用のスマートフォンアプリなどで音声とトランスクリプトされたテキストを確認できます。
参考:ソースネクスト ボイスレコーダー「AutoMemo」
スマートフォンアプリでは早い時期から音声や映像から文字起こしをするアプリが登場しています。精度が高いと評判の「Texter(テキスター)」では、リアルタイムでのトランスクリプトと共に、リアルタイムの翻訳機能が搭載されています。
参考:Texter公式サイト

トランスクリプトが発達した背景とは

ところで、本来はテープ起こしと同じ意味合いのトランスクリプトが、ここにきて急速に発展し、注目を浴びているのはなぜでしょうか。新型コロナウイルスの登場によるリモートワークの浸透がきっかけと言われますが、その根底には次のような背景が考えられます。

2000年ごろから始まったウェブアクセシビリティの考え方

Webaccessibility(ウェブアクセシビリティ)とは、「ウェブサイトの本質は、障害の有無にかかわらず誰もが使えること」という考え方から生まれた世界的な統一課題です。例えば、ポッドキャストなどの音声コンテンツや動画をホームーページに用いる場合は、聴覚障害のある方にも内容が分かるように、動画であれば字幕、ポッドキャストなどの音声であれば内容を書き起こしたコンテンツを用意しましょう、というものです。

今、この“障害”は身体的なことだけでなく、例えば“音声を聞くことができない状況”も障害だというように幅広く捉えられ、ICT(情報通信技術)を駆使した工夫が繰り返されています。その一つがトランスクリプト機能といえるでしょう。

インターネットやクラウド、AIなどICTの発達

1960年代後半に誕生したインターネットですが、一般的になったのは1990年代です。それから四半世紀で通信速度は1000倍以上速くなり、大容量・高速データ通信が実現しました。

そのおかげで、データの保管場所も手元のコンピューターやサーバーからインターネット上のクラウドコンピューターへ移行し、アップロードやダウンロードもストレスなく行えます。さらに、セキュリティ技術の進化に伴い、クラウド上のデータを関係者と共同で扱えるようになりました。

一方、1950年代に誕生したといわれるAIの技術も実用的な進化を始めた第3次ブームに入り、スクリプト機能が発達する条件がそろったのが今なのだと考えられます。

SDGsやDXなどの近年のトレンド

SDGs(Sustainable Development Goals<持続可能な開発目標>)でも、「格差や不平等をなくすこと」を目標とする活動でトランスクリプト機能が利用されています。
また、企業の生き残りに必須と注目されているDX(Digital Transformation<デジタルトランスフォーメーション>)は、デジタル技術を使って今までのやり方・考え方を変えようという概念ですが、スクリプト機能はDXを支える手段の一つになりそうです。

まとめ・トランスクリプトは必需機能。あなたは何を選ぶ?

昨年、ClubhouseやSpacesといった音声チャットのアプリ―ケーションが話題になりました。“ながら聞き”が心地いいと、最近はポッドキャストが見直され配信コンテンツも増えています。音声コンテンツの広がりを考えると、トランスクリプトは今後、仕事だけでなく日常でも当たり前に使う機能になるでしょう。

そこで重要なのは、日本語がどれだけ正確に早くトランスクリプトされるかということです。

現時点では、システム的なスクリプト機能は日本語対応していないものが多かったり精度が低かったりするので、人が行う「テープ起こし」に軍配が上がります。一方「テープ起こし」は、作業時間がかかるという点でシステム的なスクリプト機能に劣ります。
システム的なスクリプト機能の精度は今後どんどん上がるでしょうから、その発展を見守りつつ私たちは、作業内容の特徴に合わせて、「テープ起こし」とシステム的なスクリプト機能をうまく使い分けるのが良いでしょう。

参考URL

ITmediaNEWS
https://www.itmedia.co.jp/news/articles/2008/26/news058.html
https://www.itmedia.co.jp/news/articles/2011/10/news112.html

ZDNet Japan
https://japan.zdnet.com/article/35168350/

otona life
https://otona-life.com/2021/03/05/56827/

JPXオフィシャルサイト
https://www.jpx.co.jp/markets/paid-info-equities/misc/03.html

ウェブアクセシビリティ基盤員会
https://waic.jp/