字节跳动推出中文版“Sora”？回应来了

“ 字节跳动推出中文版“Sora”？回应来了 ”

发布时间：2024-02-20

今日阅读：0

来源：OSCHINA

作者：菠萝的海子

近日，市场有消息称，在 Sora 引爆文生视频赛道之前，国内的字节跳动也推出了一款新型视频模型 Boximator，与 Gen-2、Pink1.0 等既有模型相比，Boximator 的独特之处在于，它能够通过文本输入精确地控制视频中人物或物体的运动。 2月20日，字节跳动相关人士回应称，Boximator是视频生成领域控制对象运动的技术方法研究项目，目前还无法作为完善的产品落地，距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。 Sora 是 OpenAI 于日前发布的首个视频生成模型。可根据文本描述生成长达 60 秒的视频，其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。OpenAI 在技术报告介绍道，他们将 Sora 视频生成模型视作世界模拟器。具体来说就是通过跨越不同持续时间、宽高比和分辨率的视频和图像，从而生成最高可达一分钟的高清视频。 Sora 使用了一种特殊的深度学习模型即 Transformer来处理视频和图像数据。这种处理方式首先将视频和图像编码成潜在代码，然后将这些代码分解成包含时间和空间信息的小块即时空补丁，最后利用 Transformer 模型在这些补丁上进行操作。这样的处理方法能够有效地捕捉和生成视频和图像数据中的复杂时空动态，为生成高质量的视频和图像提供了一种强大的方法。相关阅读 - OpenAI 发布文本生成视频模型 Sora

推荐阅读

♦ 周鸿祎：Sora 的技术路线如果被开源，国内将能很快赶上头条

(0)

♦ 每日一博 | 深入理解 Sora 技术原理

(0)

♦ 开源日报 | 等到 Sora 开源了立刻推出属于我们自己的大模型日报

(0)

♦ 开源日报 | 为什么挡不住英伟达；Sora 不靠蛮力日报

(0)

♦ 开源日报 | Sora 给中国 AI 带来的真实变化；Dart 3.3 发布日报

(0)

每日一言

"<!doctype html> <html lang="Zh-cn"> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <meta name="robots" content="noindex,nofollow"> <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no"/> <meta name="renderer" content="webkit"> <title>您请求的文件不存在!</title> <link type="text/css" rel="stylesheet" href="https://www.oick.cn/css/404.css" /> <link rel="shortcut icon" href="http://www.oick.cn/favicon.ico" type="image/x-icon" /> </head> <body> <div id="wrap"> <div> <img src="https://www.oick.cn/imgs/404.png" alt="404" /> </div> <div id="text"> <strong> <span></span> <a href="javascript:history.back()">返回上一页</a> </strong> </div> </div> <div class="animate below"></div> <div class="animate above"></div> </body> </html>"

站点统计

本周更新文章: 0 篇

文章总数: 59110 篇

今日访问量: 26296 次

访问总量: 210500 次

👋 欢迎到来！

关注公众号