うちのマンションに外国人住民が増えてきた話——AIリップシンクで多言語の防災・生活案内動画を作ってみた

田中 芽衣田中 芽衣著
6/23/2026に公開14 min read
うちのマンションに外国人住民が増えてきた話——AIリップシンクで多言語の防災・生活案内動画を作ってみた

うちのマンションに外国人住民が増えてきた話——AIリップシンクで多言語の防災・生活案内動画を作ってみた

FreeLipSyncの実際の生成サンプル。1本の動画から複数言語版を作れる FreeLipSyncのトップページにある実際の多言語サンプル動画(英語版)のワンシーン。同じ顔・同じ口の動きで言語だけ変えられる

結論を先に

うちのマンション、ここ1〜2年で外国人の入居者がはっきり増えました。掲示板に貼ってある「台風接近時のお願い」とか「ゴミの分別ルール」、あれ全部日本語だけなんですよね。多言語のチラシを作ろうとした人もいたみたいですけど、結局「読んでもらえない」問題にぶつかって止まってます。

それで気づいたのが、文字より「人の顔が話してくれる動画」のほうが圧倒的に見てもらえるという話。今回はAIリップシンクツールのFreeLipSyncを使って、実際に多言語の案内動画を作ってみた記録です。先に言っておくと、無料でもそこそこ使えるけど、本気で町内会・自治会レベルの運用をするならStarterプラン(月額4.99ドル)くらいは要るな、という感触でした。

なぜ「文字の多言語化」だけでは伝わらないのか

総務省の調査では、多言語の防災情報が提供されている地域では「安心して暮らせる」と答えた外国人住民の割合が、提供されていない地域より20ポイント以上高いというデータがあります。問題は「提供されている」の中身で、たいていは翻訳されたPDFや掲示物止まりなんです。

これ、実際に自分が逆の立場で海外に住んでたときのことを思い出すとよくわかります。知らない言語で書かれた長文のお知らせ、正直最後まで読まないんですよ。でも誰かが顔を出して「ここが大事です」って話しかけてくる動画なら、最後まで見る。情報の量は同じでも、伝わり方が全然違う。

しかも今は2026年7月に参議院選挙も控えていて、SNSでの短尺動画発信が選挙運動でも生活情報発信でも当たり前になっています。地域コミュニティの情報発信のハードルも、もう「動画が作れて当然」という空気に変わってきている気がします。

比較:文字のお知らせ vs AIリップシンク動画

文字の多言語チラシAIリップシンク動画
制作の手間翻訳依頼+レイアウト調整が必要テキストを入力するだけ、翻訳も同ツール内でやれる範囲
高齢者・読み書きが苦手な人への到達低い(読む前提)高い(聞いて理解できる)
更新のしやすさ印刷し直しのコストがかかるテキストを書き換えて再生成するだけ
多言語展開言語ごとに翻訳発注が必要1本のテキストから言語を切り替えて量産しやすい
「顔が見える」安心感ないある(同じ担当者の顔で全言語版を作れる)

この「同じ人の顔で全部の言語版を作れる」のが地味に効きます。多言語化すると言語ごとに違う人が読んでる動画になりがちで、それだと「結局この情報、誰が責任持って言ってるの?」って不安になる。顔が統一されてると、それだけで信頼感が違います。

FreeLipSyncを実際に使ってみた

ここが今回いちばん詳しく書きたいところです。サイトはhttps://freelipsync.comで、ログイン不要で試せるのが最初のハードルの低さとしてかなり大きいです。実際にトップページにアクセスすると、顔写真か動画をアップロードして、テキスト入力・音声アップロード・録音・ボイスクローンのどれかで「話す内容」を渡す、というシンプルな3ステップ構成になっています。

FreeLipSyncの操作画面。顔写真をアップロードしてテキストを入力するだけのシンプルな構成 実際の操作画面イメージ。顔のアップロードとテキスト入力、それぞれのパネルが左右に並ぶ構成

無料枠でどこまでできるか

無料プランは登録不要・クレジットカード不要で、20秒までの動画、133文字までのテキスト読み上げが作れます。ウォーターマークは付きません。これは町内会のお試し用途には十分で、「来週の集団回収について」みたいな短い案内なら無料枠で完結します。ただ1本ずつしか処理できないので、複数言語をまとめて作ろうとすると地味に時間がかかります。

有料プランの違い

実際に料金ページ(https://freelipsync.com/pricing)も見てきました。3段階あって、

  • Free(無料):20秒まで、133文字、ウォーターマークなし、同時1本
  • Starter(月額4.99ドル、セール中は通常9.90ドルから50%オフ):月20本のPro動画、同時3本まで、3分までの動画、800文字まで
  • Pro(月額29.99ドル、通常69ドルから57%オフ):Pro動画が無制限、同時10本まで、最大60分の長尺、16,000文字の長文スクリプト、優先処理キュー

地域の防災案内・ゴミ出しルール・回覧板の内容を月に何本か作る程度なら、Starterで十分すぎるくらいでした。逆に「全戸向けの避難所案内を多言語×長尺で年に何度も更新する」ような自治体レベルの運用ならProが安心です。

生成速度とクオリティ

公式の表示では生成時間は30秒程度、リップシンクの精度は98%とされています。実際に試した感触としても、テキストを入れてから出力までの待ち時間はかなり短く、「ちょっと文言を直してすぐ作り直す」というイテレーションがやりやすいのは想像以上にありがたいポイントでした。お知らせの文言って、後から「ここ誤解されそうだから直したい」ってなることが多いので、再生成のコストが低いのは実用上かなり重要です。

ボイスクローンとトーキングフォト

声をクローンする機能もあって、町内会長さんの声をそのまま使った「本人っぽい」動画にすることもできます。あるいは顔写真1枚だけでも動画化できる「トーキングフォト」的な使い方ができるので、動画を撮るのが苦手な人でも証明写真みたいな1枚から案内動画を作れるのは地域の運用としては現実的です。対応言語は500以上とされていて、英語・中国語・ベトナム語・タガログ語あたりの主要な在住外国人コミュニティの言語はほぼカバーされている印象でした。

FreeLipSyncで実際に選べるプリセット顔の一例 顔写真を自分で用意できない場合でも、サイト側のプリセット顔から選んで試すこともできる

比較対象:HeyGenだとどうなる

多言語の吹き替え・リップシンクといえばHeyGenも有名です。実際にHeyGenの動画翻訳ツールのページ(https://www.heygen.com/ja-jp/tool/video-translator)も見てきましたが、70以上の言語・175以上の方言に対応していて、元の話者の声のトーンを保ったまま吹き替えられる、という強みがあります。

HeyGenの動画翻訳ツールのプロダクト画像 HeyGenが公開している動画翻訳ツールの紹介画像

ただしHeyGenはボイスクローンを含む本格的なプランだと月額49ドルからとなっており、個人や小さな町内会レベルで継続的に使うにはコストの差がはっきり出ます。HeyGenは企業のグローバル展開やeラーニングのような「予算のある組織」向け、FreeLipSyncは「まずは無料で試して、必要な分だけ少額の有料プランに乗る」という個人・地域コミュニティ向けの使い方に向いている、という整理がしっくりきました。

どんな人に向いているか

  • 町内会・自治会・マンション管理組合で、外国人住民向けの掲示やお知らせを動画化したい人
  • 自主防災組織で、台風・地震などの注意喚起を多言語で素早く出したい人
  • NPOや国際交流協会で、生活オリエンテーションの資料を動画に置き換えたい人
  • 個人でも、近所の外国人の友人や同僚にちょっとした案内を動画で送りたい人

逆に、すでに専門の動画編集チームと予算がある自治体の本格プロジェクトなら、HeyGenのような高単価ツールのほうが向く場面もあると思います。

おわりに

正直、最初は「動画なんて作るの大変そう」って腰が重かったんですけど、実際にやってみたら文章を打ち込んで待つだけで、思っていたよりずっと簡単でした。掲示板にずっと貼られたまま誰も読んでいないチラシを、ちょっとだけ手間をかけて動画に変えるだけで、ご近所の安心感が変わるなら、それはやる価値があると思っています。

まずは無料枠で1本、近所の掲示物を多言語動画にしてみるところから始めてみてください。

https://freelipsync.com

参考リンク