YouTube の動画を MP4 形式でダウンロードして、映像と音声をそのまま保存できます。 YouTube が内部で使っている DASH ストリーミング方式、映像コーデック(H.264 / VP9 / AV1)の違い、 MP4 コンテナの構造、解像度とビットレートの関係まで、 動画ダウンロードに必要な知識を映像エンジニアの視点から網羅的に解説します。
YouTube の URL をペタリと貼り付けて、MP4 で無料ダウンロード
YouTube の動画再生は、ブラウザに1つの動画ファイルを丸ごと送っているわけではありません。 DASH(Dynamic Adaptive Streaming over HTTP)と呼ばれる方式で、 映像トラックと音声トラックを別々のストリームとして配信しています。
たとえば 1080p の動画を再生するとき、ブラウザは裏側で「1080p H.264 映像ストリーム」と 「AAC 128kbps 音声ストリーム」を同時にダウンロードし、JavaScript の MediaSource API で リアルタイムに合成して再生しています。 回線速度が低下すると、ブラウザは自動的に 720p や 480p のストリームに切り替えます。 これが YouTube の画質が自動調整される仕組みです。
この DASH 方式は、ユーザーの帯域幅に応じた最適な体験を提供するための優れた設計ですが、 動画をダウンロードする際には「映像と音声が別々」であることが問題になります。 映像ストリームだけを取得すると無音の動画になり、音声ストリームだけを取得すると映像のない音声ファイルになります。 MP4 としてダウンロードするには、両方のストリームを取得してから 1つの MP4 コンテナに「多重化(マルチプレクス)」する工程が不可欠です。
| itag | 種類 | コーデック | 解像度 / ビットレート | コンテナ |
|---|---|---|---|---|
| 137 | 映像 | H.264 (AVC) | 1080p / ~4,000 kbps | MP4 |
| 248 | 映像 | VP9 | 1080p / ~2,500 kbps | WebM |
| 399 | 映像 | AV1 | 1080p / ~2,000 kbps | MP4 |
| 140 | 音声 | AAC (LC) | 128 kbps | MP4 (m4a) |
| 251 | 音声 | Opus | ~160 kbps (VBR) | WebM |
上の表は YouTube が同じ 1080p 動画に対して用意するストリームの一例です。 H.264 と VP9 では同じ 1080p でもビットレートが大きく異なります。 VP9 は H.264 と比べて約30〜40%少ないビットレートで同等の画質を実現できるため、 YouTube は帯域幅コストを削減するために VP9 を積極的に採用しています。
YouTube が採用している映像コーデックは大きく3世代あります。 どのコーデックで配信されるかは動画の投稿時期、再生回数、解像度によって異なり、 ダウンロード時の処理内容にも直結します。
| H.264 (AVC) | VP9 | AV1 | |
|---|---|---|---|
| 策定年 | 2003年 | 2013年 | 2018年 |
| 開発元 | ITU-T / ISO (MPEG) | Alliance for Open Media | |
| 圧縮効率(対 H.264) | 基準 | 約30〜40%改善 | 約50%改善 |
| 1080p 時の目安ビットレート | 3,000〜5,000 kbps | 1,500〜3,000 kbps | 1,200〜2,500 kbps |
| エンコード速度 | 高速 | 中程度 | 非常に低速 |
| ハードウェアデコード対応 | ほぼ全デバイス | 2015年以降のPC・スマホ | 2020年以降の新しいデバイス |
| ライセンス | 有料(MPEG LA) | ロイヤリティフリー | ロイヤリティフリー |
| YouTube での採用状況 | 全動画で利用可能 | 主力コーデック | 高再生数の動画・4K/8K で優先 |
YouTube が複数のコーデックを併用する理由は明確です。 AV1 は圧縮効率が最も高く、Google にとっては帯域幅コストの削減に直結しますが、 エンコードに膨大な計算リソースが必要なため、全動画に適用するのは現実的ではありません。 再生回数の多い人気動画は AV1 でエンコードするコストに見合いますが、 再生回数の少ない動画は H.264 や VP9 のまま配信する方が合理的です。
ダウンロード時にこのコーデックの違いが影響するのは互換性の面です。 H.264 の MP4 ファイルはほぼ全てのデバイスで再生できますが、 VP9 の WebM ファイルは一部の古いデバイスや家電(テレビ、カーナビ等)では再生できません。 AV1 はさらに対応デバイスが限られます。 そのため、幅広い再生互換性が必要な場合は H.264 + AAC の MP4 形式が最も安全な選択です。
MP4(正式名称: MPEG-4 Part 14)は動画の「コンテナフォーマット」です。 コーデック(H.264 や AAC)が映像・音声データの圧縮方式であるのに対し、 MP4 はそれらの圧縮済みデータを格納する「箱」の役割を果たします。 この区別は重要で、同じ MP4 ファイルでも中身のコーデックが違えば、 画質もファイルサイズも再生互換性も全く異なります。
MP4 ファイルの内部は「Atom」(または「Box」)と呼ばれる階層構造で構成されています。 主要な Atom は以下の3つです。
| Atom 名 | 役割 | 内容 |
|---|---|---|
| ftyp | ファイルタイプ識別 | MP4 のバージョン情報。再生ソフトがファイルを認識する最初の手がかり |
| moov | メタデータ | 映像・音声トラックの情報、各フレームの位置・タイミング(stts, stsc, stco)、コーデック情報、再生時間 |
| mdat | 実データ | 圧縮された映像フレームと音声サンプルの実体。ファイルサイズの大部分を占める |
ここで重要なのが moov Atom の配置です。 moov がファイルの末尾にある場合、プレーヤーはファイル全体をダウンロードするまで再生を開始できません。 moov がファイルの先頭にある場合は、ダウンロードしながら即座に再生を開始できます(プログレッシブダウンロード)。 この moov の先頭配置は「Fast Start」と呼ばれ、ウェブでの動画配信では標準的な手法です。
MP4 コンテナには映像トラックと音声トラックの2本が格納されるのが一般的ですが、 字幕トラック(テキスト)やチャプター情報を含めることもできます。 各トラックは独立したタイムラインを持ち、moov 内のサンプルテーブルで 「何秒目にどのデータを読むか」が管理されています。 この仕組みにより、シークバーをドラッグしたときに瞬時に目的の位置にジャンプできるのです。
「1080p だから高画質」というのは半分正しく、半分間違いです。 解像度はあくまで映像の画素数(1920×1080 = 約207万画素)を示すだけで、 実際の画質を決めるのはビットレート(1秒間に使えるデータ量)です。
たとえば、スライドショーのような静止画の連続は少ないビットレートでもきれいに見えますが、 スポーツ中継やゲーム実況のように画面全体が激しく動くコンテンツは、 同じ 1080p でも高いビットレートが必要です。 動きが激しいシーンでは各フレーム間の差分が大きくなり、 圧縮で省略できる情報が少なくなるためです。
YouTube はアップロードされた動画の内容に応じて自動的にビットレートを調整します。 そのため、同じ 1080p でも動画によってファイルサイズが大きく異なります。 トーク系の動画(人物が座って話すだけ)は比較的小さく、 風景やアクション映像(カメラが動き回る)は大きくなる傾向があります。
360p: 640×360 = 約23万画素(1080p の 1/9)
480p: 854×480 = 約41万画素(1080p の 1/5)
720p: 1280×720 = 約92万画素(1080p の 4/9)
1080p: 1920×1080 = 約207万画素(フル HD)
1440p: 2560×1440 = 約369万画素(1080p の 1.78倍)
4K: 3840×2160 = 約829万画素(1080p の 4倍)
以下は YouTube 動画を MP4(H.264 + AAC)でダウンロードした場合の一般的なファイルサイズの目安です。 動画の内容(動きの激しさ)によって上下しますが、目安として参考にしてください。 ビットレートは YouTube が配信する典型的な値を基にしています。
| 解像度 | 映像ビットレート目安 | 1分 | 5分 | 10分 | 30分 | 1時間 |
|---|---|---|---|---|---|---|
| 360p | 700 kbps | 6 MB | 30 MB | 60 MB | 180 MB | 360 MB |
| 480p | 1,200 kbps | 10 MB | 50 MB | 100 MB | 300 MB | 600 MB |
| 720p | 2,500 kbps | 20 MB | 100 MB | 200 MB | 600 MB | 1.2 GB |
| 1080p | 4,500 kbps | 35 MB | 175 MB | 350 MB | 1.0 GB | 2.0 GB |
| 1440p (2K) | 9,000 kbps | 70 MB | 350 MB | 700 MB | 2.0 GB | 4.0 GB |
| 2160p (4K) | 17,000 kbps | 130 MB | 650 MB | 1.3 GB | 3.8 GB | 7.5 GB |
上の数値には音声トラック(AAC 128kbps、1分あたり約1MB)も含んでいます。 VP9 コーデックの場合は同じ解像度でもビットレートが 30〜40% 低いため、 ファイルサイズもそれに応じて小さくなります。 ただし VP9 のまま保存すると WebM コンテナになり、 一部のデバイスで再生できない可能性があるため注意が必要です。
YouTube 動画を MP4 でダウンロードするとき、内部では2種類の異なる処理が発生しえます。 どちらになるかは、YouTube が配信しているコーデックによって決まります。
| 処理 | 内容 | 速度 | 画質への影響 |
|---|---|---|---|
| リマックス(再多重化) | H.264映像 + AAC音声をそのまま MP4 コンテナに格納 | 非常に高速(数秒) | 劣化なし(ビット単位で同一) |
| トランスコード(再エンコード) | VP9/AV1 映像を H.264 にデコード→再エンコード | 低速(動画の長さに比例) | 世代劣化が発生しうる |
YouTube の映像ストリームが H.264(itag 137 等)で提供されている場合、 コーデックの変換は一切不要です。 DASH で分離された映像ストリームと音声ストリーム(AAC, itag 140)を取得し、 FFmpeg の -c copy オプションで MP4 コンテナに再パッケージするだけです。 この「リマックス」処理ではデータの再圧縮が発生しないため、 元の画質がビット単位で完全に維持され、処理も数秒で完了します。
一方、YouTube が VP9 や AV1 でしか配信していない場合は、 H.264 へのトランスコードが必要になります。 VP9→H.264 の変換では、一度デコード(解凍)してから H.264 で再エンコード(再圧縮)するため、 理論上は「非可逆→非可逆」の二重圧縮による世代劣化が発生します。 ただし、十分なビットレートで再エンコードすれば、実用上は劣化を感じないレベルに抑えられます。 なお、VP9 のまま WebM コンテナで保存するという選択肢もあり、 その場合はリマックスのみで画質劣化なしにダウンロードできます。
YouTube でダウンロードしたい動画を開きます。PC の場合はアドレスバーから URL をコピー。スマホの場合は動画の下にある「共有」→「リンクをコピー」をタップします。 短縮URL(youtu.be/xxxxx)形式でも問題ありません。
ペタリコのページで URL を貼り付け、形式「MP4」を選択します。 YouTube から DASH ストリームの映像+音声を取得し、MP4 コンテナにマージします。 3分以内の動画なら無料でダウンロード可能です。
「変換する」ボタンを押すとサーバー側で映像・音声の取得とマージが始まります。 1%刻みの進捗バーで完了までの状況をリアルタイムに確認でき、 完了後「ダウンロード」ボタンから MP4 ファイルを保存します。
YouTube の動画には 24fps、30fps、60fps の3種類のフレームレートが存在します。 投稿者がどのフレームレートでアップロードしたかによって決まり、 視聴者がブラウザの設定で変更することはできません(画質選択で 1080p60 と 1080p が分かれているのはこのためです)。
| フレームレート | 特徴 | ファイルサイズへの影響 | 適した用途 |
|---|---|---|---|
| 24fps | 映画の標準。フィルムライクな見た目 | 基準 | 映画レビュー、シネマティック映像 |
| 30fps | 一般的な動画の標準 | 24fps の約1.2倍 | Vlog、トーク、チュートリアル |
| 60fps | 滑らかな動き。動きの速いシーンに有効 | 30fps の約1.5〜1.8倍 | ゲーム実況、スポーツ、ダンス |
60fps の動画は 30fps と比べて単純にフレーム数が2倍ですが、 映像コーデックのフレーム間予測が効くため、ファイルサイズは2倍にはならず、 実際には1.5〜1.8倍程度に収まります。 ゲーム実況やスポーツの動画は 60fps で撮影されていることが多く、 滑らかな動きを維持したまま保存するには、ダウンロード時にも 60fps を選ぶのが重要です。 30fps に変換してしまうとカクつきの原因になります。
YouTube では HDR(High Dynamic Range)対応の動画が増えています。 HDR 動画は従来の SDR(Standard Dynamic Range)と比べて、 より広い明暗の範囲と豊かな色彩を表現できます。 具体的には、SDR が約 6.5 段の輝度レンジなのに対し、 HDR10 は約 17.6 段のレンジを持ちます。
YouTube の HDR 動画は通常 VP9 Profile 2 または AV1 で配信されており、 BT.2020 色域と PQ(Perceptual Quantizer)または HLG の伝達関数を使用しています。 これを MP4(H.264)でダウンロードする場合、以下の問題が発生します。
| 項目 | HDR をそのまま保存 | SDR に変換して保存 |
|---|---|---|
| 色空間 | BT.2020(広色域)を維持 | BT.709(標準色域)に変換 |
| 輝度情報 | HDR メタデータを保持 | トーンマッピングで SDR に圧縮 |
| 非HDRディスプレイでの表示 | 色あせて見える(ウォッシュアウト) | 適切な色味で表示 |
| HDRディスプレイでの表示 | 本来の HDR 品質で表示 | SDR として表示(HDR効果なし) |
HDR 動画を非 HDR ディスプレイで再生すると、 全体的に色が薄く白っぽく見える「ウォッシュアウト」現象が起きます。 これは HDR の広い輝度レンジが SDR ディスプレイの狭いレンジにマッピングされないためです。 使用しているディスプレイが HDR 非対応の場合は、 SDR に変換されたバージョンをダウンロードする方が自然な色味になります。 ペタリコでは H.264 + AAC の MP4 として出力するため、 HDR 動画は自動的に SDR にトーンマッピングされ、あらゆるディスプレイで適切に表示されます。
ペタリコが YouTube の URL を受け取ってから MP4 ファイルを生成するまでの、 サーバー内部の処理フローを解説します。
YouTube Data API v3 を使って動画のメタデータ(タイトル、再生時間、サムネイル)を取得します。 この段階で動画の長さに応じたポイント消費量を計算し、ユーザーに表示します。
yt-dlp を使って YouTube から利用可能なストリーム一覧を取得し、 最適な映像+音声の組み合わせを選択します。 H.264 映像ストリームが利用可能な場合はそれを優先し、 映像と音声の両方をダウンロードします。
FFmpeg で映像トラックと音声トラックを1つの MP4 コンテナにマージします。 同時に -movflags +faststart オプションを適用し、 moov Atom をファイル先頭に配置して、ダウンロード後すぐに再生可能な状態にします。
完成した MP4 ファイルを AWS S3 にアップロードし、 24時間有効の署名付きダウンロード URL を生成します。 ファイルは24時間後に自動削除されます。
| 特徴 | 内容 |
|---|---|
| 最大画質 | 1080p(フル HD) |
| 音声コーデック | AAC 128kbps |
| コンテナ | MP4(Fast Start 対応) |
| 進捗表示 | 1%刻みリアルタイム表示 |
| ファイル保持期間 | 24時間(自動削除) |
| 対応デバイス | PC・iPhone・Android・タブレット |
| 初回ポイント | 150pt(3分以内の動画が目安) |
| 広告 / 登録 | なし / 不要 |
| MP4 | MP3 | |
|---|---|---|
| データの種類 | 映像トラック + 音声トラック | 音声トラックのみ |
| 典型的なファイルサイズ(5分) | 100〜175 MB(720p〜1080p) | 約 5 MB(128kbps) |
| 用途 | 動画の保存・オフライン再生・プレゼン資料 | 音楽・ポッドキャスト・語学学習 |
| ストレージ消費 | 大きい(映像データが大部分) | 小さい(MP4 の約 1/20〜1/35) |
| 初回無料枠 | 3分以内 | 20分以内 |
映像が不要で音声だけ聴ければ良い場合は MP3 変換 の方がファイルサイズが圧倒的に小さく、ストレージの節約になります。 映像を含めて保存したい場合は MP4 を選んでください。
YouTube 動画を保存する方法として「画面録画」を使う人もいますが、 画質・効率・実用性のすべてにおいて、MP4 ダウンロードの方が優れています。
| MP4 ダウンロード | 画面録画 | |
|---|---|---|
| 画質 | YouTube 配信と同等(劣化なし or 最小限) | 画面解像度・録画設定に依存。圧縮による劣化あり |
| 音質 | AAC 128kbps(YouTube の音声トラック直接取得) | システムオーディオ経由。マイクの周辺音混入リスク |
| 所要時間 | 動画の再生時間より短い(サーバー処理) | 動画の再生時間と同じ(リアルタイム録画) |
| ファイルサイズ | コーデック最適化済み | 録画設定次第で非常に大きくなることがある |
| UI の映り込み | なし(映像トラックのみ取得) | 再生バー・広告・通知・マウスカーソルが映り込む |
| CPU 負荷 | なし(サーバー側で処理) | 高い(エンコードと再生を同時に処理) |
画面録画は「再生→リアルタイムで録画→保存」という手順のため、 10分の動画なら10分間ずっと録画し続ける必要があります。 その間にブラウザを操作すると録画にも映り込みますし、 広告が表示されればそれも録画されてしまいます。 MP4 ダウンロードならこうした問題は一切起きません。
| デバイス / 環境 | 対応 | 備考 |
|---|---|---|
| Windows PC | 対応 | Windows Media Player / 映画&テレビ / VLC 等で再生可能 |
| Mac | 対応 | QuickTime Player / IINA / VLC 等で再生可能 |
| iPhone / iPad | 対応 | 「ファイル」アプリで再生。写真アプリにインポートも可能 |
| Android | 対応 | 標準ギャラリー / Google ファイル / VLC / MX Player 等 |
| テレビ(スマートTV) | 対応 | USB メモリ経由またはDLNA/Miracastで再生。H.264 は全メーカー対応 |
| カーナビ / 車載モニター | 対応 | SD カード / USB メモリ経由。H.264 MP4 はほぼ全機種対応 |
| ゲーム機 | 対応 | PS5 / Xbox / Nintendo Switch(USB経由)で再生可能 |
| プレゼンツール | 対応 | PowerPoint / Keynote / Google Slides に埋め込み可能 |
H.264 + AAC の MP4 は、現時点で最も再生互換性の高い動画フォーマットです。 2003年に策定されて以降、20年以上にわたってあらゆるハードウェア・ソフトウェアに デコーダが実装されてきたため、再生できないデバイスを見つける方が難しいほどです。 VP9 の WebM や AV1 は圧縮効率に優れますが、 カーナビや古いスマートテレビなど対応していないデバイスがまだ多く存在します。
YouTube は DASH 方式で映像と音声を別ストリームとして配信しています。 一部のツールは映像ストリームだけを取得して音声を結合しないことがあります。 ペタリコは映像+音声を自動的にマージするため、この問題は発生しません。 他のツールで音声なしの MP4 が生成された場合は、 ペタリコで再度ダウンロードしてみてください。
VP9 や AV1 コーデックの MP4 / WebM ファイルは、 一部のデバイスやプレーヤーで再生できないことがあります。 特にカーナビ、古いスマートテレビ、一部の Android 端末で問題が発生しやすいです。 H.264 + AAC の MP4 であればほぼ全てのデバイスで再生できます。 再生できない場合は VLC Media Player を試すか、 H.264 形式で再ダウンロードしてください。
1080p の10分動画は 300〜500 MB になることがあります。 これは正常なサイズです。映像データは音声の数十倍のデータ量があるためです。 ストレージを節約したい場合は、720p や 480p を選ぶことでファイルサイズを大幅に削減できます。 映像が不要で音声だけ保存すれば良い場合は MP3 形式(10分で約10MB)をおすすめします。
動画の長さとサーバーの負荷状況によって処理時間が変動します。 5分程度の動画であれば通常30秒〜1分で完了しますが、 長時間の動画(30分以上)では数分かかることがあります。 進捗バーが表示されている場合は正常に処理が進んでいますので、そのままお待ちください。 ブラウザを閉じても処理は継続されます。
Safari でダウンロードした場合、「ファイル」アプリの「ダウンロード」フォルダに保存されます。 Chrome の場合は Chrome アプリ内のダウンロード履歴からアクセスできます。 詳しくは iPhone での YouTube ダウンロード方法 をご覧ください。
元の動画が HDR で撮影・アップロードされている場合、 H.264 MP4 に変換すると SDR にトーンマッピングされるため、色味が変わることがあります。 これは HDR→SDR 変換の性質上避けられないものですが、 非 HDR ディスプレイではこちらの方が自然に見えます。
| YouTube Premium | MP4 ダウンロード(ペタリコ) | |
|---|---|---|
| 月額費用 | 1,280円/月 | 従量課金(1pt = 1円)初回150pt無料 |
| オフライン再生 | YouTube アプリ内のみ(DRM 保護) | 任意のプレーヤーで自由に再生 |
| ファイル管理 | YouTube アプリに依存 | ローカルファイルとして自由に管理・コピー |
| 解約後のアクセス | ダウンロード済みファイルは消去 | ダウンロードしたファイルは永久に保持 |
| 再生デバイスの制限 | YouTube アプリがある端末のみ | 制限なし(TV、カーナビ、プレゼンにも利用可) |
| 広告なし | Premium 特典として付属 | ペタリコは広告なし(ダウンロードツールとして) |
YouTube Premium のオフラインダウンロードは DRM で保護されているため、 YouTube アプリ以外では再生できず、解約するとファイルも消えます。 プレゼン資料への埋め込み、カーナビでの再生、テレビの USB 再生など、 YouTube アプリ外で使いたい場合は MP4 ダウンロードが適しています。
ペタリコは広告なし・ポップアップなし・登録不要で、HTTPS 暗号化通信を使用しています。変換処理はサーバー側で完結し、 ダウンロードしたファイルは24時間後に自動削除されます。 詳しくは安全性についてをご覧ください。
日本の著作権法第30条では、私的使用目的の複製は認められています。 ただし、違法にアップロードされたコンテンツと知りながらダウンロードする行為は 2012年の改正で違法化されました。 公式チャンネルの動画を個人利用する範囲でご利用ください。再配布・商用利用は違法です。
はい。元の動画が 1080p 以上で投稿されていれば、フル HD 画質でダウンロードできます。 ただし、YouTube が H.264 で 1080p を配信していない場合(VP9 のみの場合)は、 トランスコードが行われるため処理時間が長くなることがあります。
現在ペタリコは最大 1080p に対応しています。 4K 動画もダウンロード可能ですが、出力は 1080p に制限されます。 1080p は一般的なスマホやノートPCの画面解像度をカバーする十分な画質です。
はい。iPhone の Safari や Chrome からペタリコにアクセスするだけで、 アプリなしで YouTube 動画を MP4 で保存できます。 詳しくはiPhone での YouTube ダウンロード方法をご覧ください。
はい。3分以内の動画であれば、初回150ptで MP4 ダウンロードできます。それ以上は1pt(1円)からの従量課金です。月額料金はありません。
YouTube の動画タイトルがそのままファイル名になります。 日本語タイトルの場合は日本語のファイル名で保存されます。
YouTube の URL をペタリと貼り付けて、MP4 で無料ダウンロード