最近のAIの進化には驚かされることが多いですね。
Youtubeの字幕機能の精度も飛躍的に向上しており、以前だったら笑いものにされていましたが、最近はノイズが入っていなければ9割程度には正確な文字起しができるのではないかとすら感じてしまいます。
そして文章要約にも驚かされました。
以前だったら使われている単語の傾向から、重要そうな文章を抜き出して無理やり繋げ合わせている感がありましたが、今はほとんど自然に正しく要約が出来ている印象があります。
そこで今回は、私が以前作った3つの動画を使って、AIの文字起しと要約がいかに高精度なものなのかを確かめていきたいと思います。
用意した3つの動画はいずれもかつて私が作った解説動画となります。
そのうちの最初に紹介する動画はyoutubeの動画なので、こちらはyoutubeの自動での文字起し機能を駆使したうえでこちら(https://ai-tool.userlocal.jp/chatgpt-digest)のサイトで要約をしました。
要約の設定は[入力文章形式 していない、 出力文字数 自動、 AIを選択 ChatGPT-4o]にしています。
そして残りの2つはニコニコ動画で投稿したものなので、こちらはyoutubeのような文字起し機能はありませんが、(https://www.notta.ai/)このサイトで文字起しをさせていただきました。
そのうえで個人的にその要約にどの程度満足できたかを5点満点で評価していきたいと思います。
では見て行きましょう。
1つ目 オリンピック(u-24)メキシコ代表 選手紹介 (GK・DF) 【サッカー】
要約内容
オリンピックが始まる中で、日本代表が金メダルを目指し、メキシコ代表との戦いが注目されています。この動画では、メキシコ代表の選手について紹介します。メキシコの守護神で精神的支柱とされる選手は、クラブアメリカに所属する36歳の選手で、代表戦に110試合以上出場しています。彼はペナルティセービングが得意で、反射神経に優れており欧州の中堅クラブで活躍した経験があります。控えのキーパーには、セバスティアン・フラド選手やルイス・マダゴン選手がいます。 次に、ディフェンダーの紹介です。オーバーエイジ枠で参加するロイス・ルモ選手は、ディフェンダーとしてもミッドフィールダーとしてもプレーが可能で、市場価値は800万ユーロです。セサル・モンテス選手は長身センターバックで、空中戦に強く、セットプレーでの貢献が期待されます。彼の市場価値は600万ユーロです。 また、左利きのヨハン・バスケス選手はボール奪取能力が高く、空中戦にも強い一面を持ちますが、攻撃への貢献が課題です。市場価値は600万ユーロです。さらに、ケビン・アルバレス選手とチャーリ・ロドリゲス選手も紹介され、彼らはそれぞれサイドバックとしての役割を果たしています。 最後に、控えの選手であるブラディミール・ロローニャ選手とアドリアン・モラ選手についても言及されています。メキシコ代表の組織的な守備が予想され、日本とメキシコ代表の試合は1点が重くなる展開が考えられます。メキシコ代表には欧州でプレーする選手が少ないものの、ヨーロッパに進出する可能性のある選手が複数おり、オリンピックを通じて評価を上げる可能性があります。最後に、メキシコ代表の総評として、難しい相手であることが強調されています。
満足度:4.5 / 5
ほぼ要約で来ているのではないかと感じております。ただゴールキーパーの名前が抜けていたのはちょっと悲しいところ。
でもまあ、ちゃんと選手の特徴についても短くまとめている、という面ではきちんとできてるしgoodな満足度です。
2つ目 きりたんの適当なマイナーサッカークラブ紹介 6回目
要約内容
東北きりたんがマイナーフットボールクラブについて解説する動画では、ウズベキスタンの位置やその歴史について述べています。ウズベキスタンはかつてソビエト連邦の一部であり、インフラは旧ソビエト時代に築かれたものが基盤となっており、特に1977年に開業した地下鉄は美しい装飾とアートが特徴です。ウズベキスタン鉄道が創設したサッカークラブ、Pfcロコモティフタシュケントは、2002年に設立され国内リーグで2016年から2018年にかけて三連覇を成し遂げた実力派クラブです。クラブはかつては10位前後に甘んじていましたが、2010年の降格を経て強化され、現在ではウズベキスタンのトップクラブの一つとなっています。ライバルには、ソビエト時代から続く名門FCパフタコールタシュケントや、巨大スポンサーを持つ新興クラブFCブニョドコルがあり、これらのクラブがタシュケントに位置し、ウズベキスタンスーパーリーグの勢力図を形成しています。
満足度:5/5
残念ながらフリープランのため、文字起しは動画の最初3分までしかできませんでしたが、要約の内容自体はほぼ完ぺきと言って差し支えないでしょう。
まさに求めていた内容が示されていました。文字起しと要約の技術、その両方に驚かされる結果です。
3つ目 第1回 サッカー動画と東北きりたんとなかまたち(9:07~11:00の範囲のみ)
要約内容
あるサッカーチームは99歳で、プリメイラディビジョンで5回のリーグ優勝を果たしています。収入は6365万ユーロで支出は6252万ユーロ、今年は特に目立った活動はしていないが、ローンで選手を獲得しています。日本人選手は現在いませんが、昨年までは在籍していました。また、風雲カップで準優勝の経験があり、日本での放送も行っており、毎試合放送されています。昨シーズンのリーグ順位は16位でした。
満足度:4/5
そもそもあまり長い動画ではないため、もともとの情報量から半分程度しか削られていないわけですが…。
これもちゃんと文字起しされていてすごいなと思いました。ちなみに動画の音声情報の中には確かにチーム名についての情報が無かったため、或るサッカーチームと表記されるのは仕方が無いことだしむしろ感心することだと思います。というかこの動画自体かなり攻めた内容であり、要約するのはかなり困難を極めると思っていましたが、必要な情報をちゃんと抽出していることには本当に驚かされました。ただ、風雲カップは誤情報。これは文字起し機能側で、「ふうん」という感嘆詞を「風雲」と聞き違えて起きてしまっている誤情報だと考えられます。風雲カップではなく、UEFAカップと表記してくれていたら満足度5点満点でありました。
いかがでしたでしょうか。私個人としては本当に感心させられる結果でしたが、あまり実感が出来ていない方がいらっしゃるかもしれませんね。
でしたら、youtubeの解説動画をご覧いただき字幕機能があった際には、動画概要の「文字起こしを表示」をクリックして、出てきた字幕の情報を文章要約サイトにそのままコピペしていただければと思います。
そうすればきっと驚かれることでしょう。
ただ個人的な意見を述べるとするならば、簡単に文字起こしができるようになったということは、簡単に動画の情報をコピペできる段階に大幅に近づいているということ。
こうした技術の進展には必ずリスクもあるために、良識的な範囲でこの技術が使われ発展していくことを祈っております。