コンテンツにスキップ
Zenn Dev Kitepon Articles Livetr Complete Sentence

完全な文だけを訳に回す——その設計を、カウンタ一本が裏切っていた

  • URL: https://zenn.dev/kitepon/articles/livetr-complete-sentence
  • 日付: 2026-06-21
  • Tier: Tier 3
  • 要旨: LiveTR(英語動画リアルタイム日本語化アプリ)で字幕が混線するバグを追跡。原因は 5 秒ごと音声認識の境界で文が途中で切れたとき、切れ端の「続きが来ない判定」をするカウンタが逆さまに配線されていたこと。1 行修正で完全な文だけが翻訳に渡されるよう改善。

詳細

リアルタイム翻訳は 5 秒ごと区切られた音声認識テキストを扱うが、文の途中で区切られる。LiveTR は切れ端を抱えておき、次 5 秒で続きが来たらつないで完全な文にしてから翻訳エンジン(DeepL・Google など)に渡す設計。ところが「もう続きが来ない」と見切るカウンタが逆向き配線されていたため、残るべき切れ端が宙に浮き、次の 5 秒の別の人のセリフにくっつく現象発生。例:「we really need to」の途中で落ちて、その後「Yeah anyway the budget is fine」と別人がしゃべると、「we really need to anyway the budget is fine」という誰も言わない文になる。デモが「動いていた」のは、カットしないフル素材で、ソース時間=プログラム時間が一致していたため。1 行修正で見切りの向きを直すだけで、翻訳エンジンには一切手を入れず、同じエンジンが正確な訳を返すようになった。