对齐_3D标签 - 大屏时代

Pika 2.0横扫Sora惊艳全网，一键颠覆广告业！

AI视频创作的新时代在AI视频创作领域，技术的飞跃不断挑战传统观念，而最新的创新者Pika 2.0无疑是这一变革中的佼佼者。自推出以来，Pika 2.0的强大功能引发了广泛关注，它不仅重新定义了视频创作的门槛，还在广告、娱乐等多个行业掀起了风暴。作为AI视频创作领域的新宠，Pika 2.0凭借其惊人的场景元素功能、卓越的文本对齐能力以及对物理世界规律的深刻理解，彻底颠覆了广告创作的游戏规则。场景元...

重磅突破！新型文本驱动风格转换技术大幅提升图像生成质量

在人工智能图像生成领域，文本驱动的风格转换技术近年来取得了显著进展。这项技术通过将参考图像的风格与文本提示相结合，能够生成符合指定内容和艺术风格的图像，广泛应用于数字绘画、广告设计、游戏艺术等多个行业。然而，现有的风格转换技术依然面临一些挑战，如风格过拟合、文本与图像内容的对齐不准确、以及生成过程中常出现的伪影等问题。近日，研究人员提出了一种创新性的解决方案，借助三种互补策略，大幅提升了图像生成的...

OpenAI发布最强推理模型o3及其精简版o3-mini：推理能力提升至接近人类水平

2024年12月21日，OpenAI在其为期12天的发布活动中，推出了新一代推理系列模型——o3及其精简版o3-mini。作为o1系列的继任者，这两款模型专为增强推理能力而设计，旨在提升模型在回答问题前的思考深度，最终提高回答的准确性。o3：接近人类水平的推理能力o3模型的发布标志着OpenAI在人工智能推理能力上的重大突破。通过在ARC-AGI基准测试中的优异表现，o3成为了首个突破该基准的AI...

谷歌 DeepMind 推出新框架 InfAlign：提升语言模型推理对齐能力

谷歌 DeepMind 和谷歌研究团队推出了一款名为 InfAlign 的新型机器学习框架，旨在改善生成式语言模型在推理阶段的对齐能力。生成式语言模型在从训练到实际应用的过程中，经常面临不同程度的挑战，其中一个关键问题就是如何确保模型在推理阶段能够达到最佳表现。当前挑战：训练与实际应用的差距尽管现代语言模型通过强化学习和人类反馈（如RLHF）等方法不断提高其表现，这些方法往往侧重于提升模型的“胜率...

ChatGPT卷入爆炸案刷屏，AI安全挑战迫在眉睫：我们必须为AI打造“安全刀鞘”

2025年1月11日，随着AI技术的迅猛发展，一个令人震惊的事件震动了全球：ChatGPT被指为“恐怖分子”的帮凶，参与了美国一位现役军人的爆炸案。这一事件发生在美国，嫌疑人通过AI获得了有关爆炸物制造的知识，并成功制造爆炸，造成一辆特斯拉Cybertruck在酒店门口爆炸。这一事件不仅将AI应用的风险暴露无遗，也让AI安全问题从技术领域走向社会的关注焦点。AI安全：新年新挑战，带来的不只是科技进...

豆包大模型全流程革新：Seedream 2.0技术报告引领图像生成新时代

字节跳动旗下豆包大模型团队今日正式发布了全新的文生图技术报告，首次对外公开Seedream 2.0图像生成模型的核心技术细节。该报告涵盖从数据构建、预训练框架到后训练RLHF全流程，为智能图像生成领域注入了强劲动力。自2024年12月初在豆包APP与即梦平台上线以来，Seedream 2.0已服务上亿终端用户，迅速成为众多专业设计师在创作辅助上的首选工具。相比Ideogram 2.0、Midjou...

OpenAI推迟开源大模型：AI安全与开放边界的全球博弈

一次“跳票”背后的AI治理困局2025年7月，OpenAI突然宣布推迟其首个开源权重大模型的发布计划。这一决定迅速引发行业震动——毕竟，这家以“开放”命名的公司，过去十年从未真正开源其核心模型（如GPT系列）。此次承诺的“开放模型”本被视为OpenAI战略转向的标志，但临门一脚的刹车，却暴露出AI行业最尖锐的矛盾：在技术进步与安全风险之间，人类究竟该如何划定边界？一、OpenAI的“开放悖论”：为...

前OpenAI CTO Mira Murati新公司获20亿美元种子融资，估值120亿剑指多模态AI革命

AI领域再现“天价融资”，Murati携全明星团队开启新篇章2025年7月，前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab宣布完成20亿美元种子轮融资，估值飙升至120亿美元。这一数字不仅刷新了AI初创公司的早期融资纪录，更标志着资本市场对多模态通用人工智能（AGI）的强烈信心。领投方a16z及NVIDIA、AMD等科技巨头的加持，预示着新一轮AI技...

首页 1 尾页