最新 最热

视频生成大模型Sora:开启视频创作新纪元,下一个风口吗?

近日,人工智能领域的领军企业OpenAI宣布推出了一款名为Sora的全新视频生成大模型,这一创新性的技术成果有望彻底改变视频创作领域的格局。Sora模型以其强大的视频生成能力,为用户提供了一个快速、便捷且极具创意的视频制...

2024-02-29
1

[译] Objective-C 中我接受的点符号

我曾一直是点符号的坚定反对者。我认为它掩盖了消息传递,并鼓励程序员通过链式点语法来违反 "得墨忒耳定律(Law of Demeter) "。我甚至将点符号描述为 Objective-C 代码的一种气味。...

2024-02-29
0

I3D笔记 - plus studio

I3D是一个视频理解模型,采用双流网络的架构,他的核心贡献是提出了如何对2d网络进行膨胀操作,同时提出了一个新的数据集 Kinetics

2024-02-28
1

理解 FFmpeg 中的 pts,dts,time_base

PTS:Presentation Time Stamp。PTS主要用于度量解码后的视频帧什么时候被显示出来。

2024-02-28
1

高效网络采集实践:使用 Haskell 和 html-conduit 下载 www.baidu.com 视频完整教程

网络采集在当今信息时代中发挥着关键作用,用于从互联网上获取数据并进行分析。本文将介绍如何使用 Haskell 进行网络编程,从数据采集到图片分析,为你提供一个清晰的指南。我们将探讨如何使用爬虫代理来确保高效、可靠的...

2024-02-27
1

如何渲染最原始的yuv视频数据?

我们在用纹理增加细节那篇文章中提到过,要将图片渲染在屏幕上,首先要拿到图片的像素数组数据,然后将像素数组数据通过纹理单元传递到片段着色器中,最后通过纹理采样函数将纹理中对应坐标的颜色值采样出来,然后给最终的片段...

2024-02-27
1

聊聊火出圈的世界AI大模型——Sora

在2024年2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。这意味着,继文本、图像之后,O...

2024-02-26
0

谷歌Gemini1.5火速上线:MoE架构,100万上下文

Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合 (MoE) 架构使 Gemini 1.5 的训练和服务更加高效。

2024-02-26
0

Sora理论基础,论文作者解释原理

这是构成Sora基础之一的Diffusion Transformer论文作者关于Sora的一些猜测和技术解释。

2024-02-26
1

音视频面试题集锦第 16 期

通常我们通过 AVCaptureSession 相关的 API 来进行音视频的采集,其中主要组件分为 Input、Output、Session 几个部分:

2024-02-26
1