top of page

動画・映像制作用語辞典 | 名古屋映像制作研究室

リップシンク

「リップシンク(Lip Sync)」とは、映像や音声の制作において、キャラクターや人物の口の動きを音声と一致させる技術のことです。文字通り「唇の同期」を意味します。

リップシンクは、アニメーションCG、映画、音楽パフォーマンスなど、さまざまな分野で活用されています。



技術的には、以下のような方法があります



1. 手作業による調整

アニメーターやCGアーティストが、音声に合わせて手作業で口の動きを調整します。



2. 自動リップシンクツール

 音声データを解析し、自動的に口の動きを生成するソフトウェアを使用します。



3. AI技術の活用

近年では、AI技術を活用したより高度なリップシンクも開発されています。



リップシンクと口パクの違い


リップシンクと口パクは似た言葉ですが、ニュアンスが異なります。リップシンクは映像や音声の制作技術全般を指し、口の動きと音声を正確に一致させることを目的としますが、口パクは録音された音声に合わせて口を動かす行為を指し、必ずしも正確な一致を求めない場合があります。



リップシンクの活用例


アニメーション作品

キャラクターのセリフに合わせて口を動かす


映画・テレビドラマ

俳優のセリフと口の動きを一致させる


音楽パフォーマンス

歌手が録音された音源に合わせて口を動かす


Vtuber

音声に合わせてアバターの口を動かす



問われる正確性


リップシンクのズレに対する人間の知覚は、いくつかの要因によって異なりますが、一般的には以下のように考えられています。(fps = 30f/sec.)


一般的な認識


1フレーム(約33ミリ秒)以内

ほとんどの人は、この程度のズレには気づかないと言われています。
プロの現場でも、許容範囲とされます。

2~3フレーム(約66~100ミリ秒)

注意深い人は、わずかなズレに気づき始める可能性があります。
特に、ニュースやインタビューなど、正確性が求められる映像では、違和感を覚えることがあります。

4フレーム(約133ミリ秒)以上

ほとんどの人が、明確なズレを認識し、違和感を覚えます。
視聴者は、映像に対する信頼性を損なう可能性があります。


影響を与える要因


映像の種類

ニュースやインタビューなど、人間の顔が大きく映る映像は、ズレに敏感です。
アニメやゲームなど、抽象的な映像は、多少のズレがあっても気づきにくいことがあります。

視聴者の集中度

映像に集中しているほど、わずかなズレにも気づきやすくなります。
ながら見の場合は、多少のズレがあっても気にならないことがあります。

音量

音量が大きい場合、ズレが強調されて聞こえる場合があります。

デジタル技術の進歩により、リップシンクの精度は向上していますが、ネットワークの遅延など、新たな課題も生まれています。リップシンクのズレは映像の品質を大きく左右する要因の一つです。

<h1 class="font_0">リップシンク</h1>

​【関連用語】

1. フレーム


映像やアニメーションを構成する静止画の1コマを指します。動画は、このフレームを連続して表示することで、動きを表現します。パラパラ漫画の1枚1枚の絵をイメージすると分かりやすいでしょう。



2. fps


Frames Per Secondの略で、1秒間に表示されるフレーム数を示す単位です。フレームレートとも呼ばれます。数値が大きいほど、動画は滑らかに見えます。一般的な動画のfpsは、24fps、30fps、60fpsなどがあります。映画は24fps、テレビ放送は30fpsまたは60fps、ゲームは60fps以上が一般的です。



3. bps


Bits Per Secondの略で、1秒間に転送できるデータ量を示す単位です。ビットレートとも呼ばれます。数値が大きいほど、高速なデータ転送が可能です。インターネット回線速度や、動画・音楽ファイルのデータ量を表す際に使われます。



4. bpm


Beats Per Minuteの略で、1分間の拍数を示す単位です。音楽のテンポを表す際に使われます。数値が大きいほど、テンポが速いことを意味します。DJや音楽制作の現場でよく使われます。



5. Hz(ヘルツ)


1秒間に繰り返される現象の回数を示す単位であり、周波数(振動数)を表します。

【当サイト関連ブログ】

ブログカテゴリー「録音・音声」



 

 

映像制作のことなら何でも・・・株式会社SynAppsへ

bottom of page