模型_3D标签 - 大屏时代

深度解读：OpenAI Sora的发布与视频生成AI的新机遇

2024年12月9日，OpenAI发布了备受期待的文本生成视频模型Sora。这不仅是人工智能领域的一次技术突破，更是推动数字内容创作进入新阶段的重要里程碑。发布会上，OpenAI首席执行官Sam Altman与Sora负责人Bill Peebles携手介绍了这款全新产品，吸引了全球关注。颠覆视频生成的6大功能Sora采用先进的扩散模型技术，能够从看似静态噪声的视频开始，逐步去除噪声并生成高质量的视...

智谱华章推出免费多模态API：GLM-4V-Flash开启图像处理新时代

北京智谱华章科技有限公司近日宣布，其旗下的智谱开放平台BigModel正式上线首个免费的多模态API——GLM-4V-Flash。这一新模型基于4V系列模型的优秀能力，在图像处理领域实现了显著的技术突破，进一步降低了开发者探索和应用大模型的门槛。GLM-4V-Flash：多模态AI的新里程碑GLM-4V-Flash是智谱开放平台推出的最新力作，以强大的多模态处理能力为核心，支持图像描述生成、图像分...

Adobe携手MIT发布CausVid：1.3秒首帧，开启视频生成新时代

想象一下，仅需1.3秒，你就能生成一段高质量、流畅自然的视频内容。这不是科幻，而是Adobe与麻省理工学院（MIT）联合推出的全新视频生成模型 CausVid 带来的现实。作为一次颠覆性突破，CausVid不仅将视频创作效率提升到前所未有的高度，还重新定义了实时生成视频的行业标准。从“等待”到“瞬间”：CausVid的技术魅力CausVid的问世，改变了视频生成需要漫长计算的传统模式。通过首创的因...

巨人网络发布“千影”有声游戏大模型：AI让人人皆可成“游戏开发者”

2024年，中国游戏产业迎来新一轮技术突破。巨人网络在年度游戏产业年会上正式发布“千影”有声游戏大模型，通过人工智能的强大能力，致力于让每个人都能轻松创作属于自己的游戏。这一革新标志着“游戏+AI”的深度融合，为游戏创作打开了全新大门。【“千影”大模型的技术亮点】“千影”大模型由两个核心模块组成：YingGame和YingSound。其中，YingGame专注于开放世界游戏的视频生成，由巨人网络A...

人工智能加速发展，行业应用与创新迈向新高峰

随着全球人工智能技术的不断突破和应用场景的快速扩展，人工智能（AI）已成为各行各业发展的重要推动力。过去48小时内，人工智能领域发生了一系列重要事件，展示了其在医疗、教育、产业以及创新技术方面的快速发展。中国人工智能大会开幕，推动行业创新12月14日，第十届中国人工智能大会在北京盛大开幕，吸引了来自政府、学术界和产业界的各界人士。大会发布了《北京人工智能产业白皮书（2024）》，显示北京在人工智能...

清华系AI创业公司无问芯穹发布端侧全模态理解小模型 Megrez-3B-Omni，开源推向市场

2024年12月16日，清华系AI基础设施创业公司无问芯穹（Infinigence）宣布正式开源其端侧全模态理解小模型 Megrez-3B-Omni，并同步发布其纯语言版本 Megrez-3B-Instruct。此次开源的Megrez-3B-Omni具有强大的图片、音频和文本三种模态数据处理能力，成为端侧智能设备的一项重要技术突破。Megrez-3B-Omni：为端侧设备量身定制的全模态理解模型M...

百川智能专注医疗赛道，王小川解读AGI与生命科学的未来愿景

2024年12月16日，在极客公园IF2025创新大会上，百川智能创始人兼CEO王小川与极客公园创始人张鹏展开对话，深入探讨了百川智能在医疗领域的布局、AGI（通用人工智能）的进展以及生命科学的未来。作为国内唯一一家专注于医疗方向的大模型创业公司，百川智能的选择引发了业界的广泛关注。聚焦医疗赛道，AGI赋能生命科学王小川在对话中表示，选择医疗作为公司发展方向，是他多年来的梦想与理性思考的结合。早在...

Nexa AI 发布 OmniAudio-2.6B：为边缘设备提供高效音频语言模型

2024年12月16日，Nexa AI宣布推出全新的OmniAudio-2.6B音频语言模型，专为边缘设备的高效部署而设计。与传统的将自动语音识别（ASR）和语言模型分开的架构不同，OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一的框架中，从而有效消除了传统系统中各个组件链接所带来的低效率和延迟问题。该模型特别适用于计算资源有限的设备，如...

Meta与Cameron联手打造3D沉浸式世界，谷歌/WiMi创新引领全息虚拟现实

2024年12月16日，Meta公司（$META）近日宣布与詹姆斯·卡梅隆（James Cameron）创办的Lightstorm Vision公司达成新的合作伙伴关系，共同创建世界级的3D娱乐体验。这一合作将在Meta Quest平台（Lightstorm Vision专属MR硬件平台）上推出，涵盖包括现场体育赛事、音乐会、电影及电视剧等多种沉浸式内容，且均由知名IP提供支持。3D沉浸体验的创作...

AI与版权之争：创意产业与科技创新的博弈

随着人工智能（AI）技术的迅猛发展，尤其是在生成式AI模型领域，版权问题成为了全球范围内亟待解决的焦点之一。AI技术正在以前所未有的速度进化，而与其相关的知识产权争议也在逐渐升温。AI的训练过程往往依赖于大规模的数据输入，而这些数据通常包括了大量创意作品，如文本、图片、音乐、视频等，这些作品大多由创作者或版权持有者拥有版权。在这种情况下，AI是否有权使用这些作品来训练模型？创作者是否应该得到赔偿？...

亚马逊云科技的基础大模型战略：从“Scaling Law撞墙”到持续投入

在人工智能的浪潮中，大模型（Large Language Models, LLMs）成为了技术进步的焦点。随着AI技术的飞速发展，关于“Scaling Law是否撞墙”的争论成为了学术界和产业界的重要话题。近期，亚马逊云科技在2024年re:Invent大会上发布了新的基础大模型系列Nova，展示了其在AI领域的长远布局。尽管大模型的增长潜力受到“Scaling Law”理论的挑战，亚马逊依然坚定...

Meta推出Apollo开源模型：让AI“看懂”视频的突破性进展

随着人工智能的快速发展，AI在图像和文本理解方面取得了显著进展，但让机器真正理解视频内容，依然是一个巨大的挑战。视频不仅包含复杂的动态信息，还需要处理随时间变化的物体和场景，如何使AI具备视频理解的能力，一直是研究的难点。2024年12月18日，Meta联合斯坦福大学推出了全新的AI模型系列——Apollo，该模型显著提升了AI在视频理解方面的能力，标志着视频AI处理领域的一个重要突破。视频理解的...

字节跳动火山引擎全域AI搜索发布：开创精准推荐与多模态搜索新纪元

2024年12月18日，字节跳动在其火山引擎FORCE原动力大会·冬上发布了全新的火山引擎全域AI搜索。这项服务通过整合场景化搜索推荐、企业私域信息整合以及联网问答服务，进一步推动了企业与用户需求的深度融合，提升了信息发现的精确度与广度。凭借强大的AI能力和大规模的实时内容支持，火山引擎全域AI搜索不仅为企业提供了精准的推荐和信息查询能力，也为用户带来了更加个性化和多元化的搜索体验。多模态搜索：打...

豆包音乐模型创新升级：推动音乐创作进入智能化新纪元

在2024年12月18日的火山引擎FORCE大会上，字节跳动的火山引擎CEO谭待宣布了一项令人瞩目的技术升级——豆包通用模型Pro的全面提升及其在多个领域的应用进展。此外，豆包音乐模型的最新升级也成为了本次大会的一大亮点。这项创新不仅为音乐创作带来了极大的灵活性与创意空间，还为整个音乐制作行业的智能化转型提供了新的方向。豆包通用模型Pro：AI技术全面升级在本次大会上，谭待特别提到了豆包通用模型P...

AI当“地陪”？澳门旅游局的智能转型

随着科技的不断进步，人工智能（AI）在多个行业的应用日渐普及，旅游业也不例外。近年来，全球各大旅游城市纷纷探索AI技术在提升游客体验和优化服务中的潜力。而澳门旅游局便在这一创新潮流中领先一步，推出了基于AI大模型的智能旅游助手“麦麦”，将传统的旅游服务体验带入了全新的智能时代。1. 旅游服务的智能化转型“麦麦”并非普通的智能客服，而是一款借助大模型AI技术打造的智能旅游助手。通过百度智能云与澳门电...

智源研究院与腾讯达成战略合作推动大模型、AI等应用落地

2024年12月18日，智源研究院与腾讯集团正式签署战略合作协议，标志着双方在人工智能领域的深度合作进入新的阶段。此次合作，双方将携手推进大模型研发、AI技术的前沿探索以及开源生态建设等多个方向，推动AI技术在产业场景中的深度应用与落地。这一合作不仅为两家公司带来了技术创新的新机遇，也为中国乃至全球的人工智能发展注入了强大的动力。1. 战略合作的背景与意义随着大数据、云计算和人工智能技术的不断发展...

首页 1 2 3 4 5 6 7 8 尾页