2024年11月28日,香港——近日,一名香港议员和一名工会理事在分别遭遇电信诈骗时,均被骗子利用人工智能(AI)技术伪装成熟悉的声音进行诈骗。该事件引起社会广泛关注,尤其是对AI语音伪造技术滥用带来的风险和隐私保护问题的讨论。1. AI语音伪装借钱电信诈骗根据香港警方的通报,犯罪分子通过AI技术伪造了受害人熟悉的声音,冒充他们的亲朋好友或同事,通过电话联系他们并声称自己陷入紧急情况,需要借钱。受...
2024年11月28日,新竹——新竹台大分院近日宣布与人工智能(AI)技术合作,推出全新的AI语音病历系统,并结合视讯看诊服务,旨在提升医疗服务的效率与质量。这一创新服务不仅能减轻医护人员的负担,还为患者提供了更加便捷和智能的就医体验,尤其是在远程医疗和健康管理领域具有重要意义。1. AI语音病历:提升诊疗效率新竹台大分院通过引入AI语音识别和**自然语言处理(NLP)**技术,开发了全新的语音病...
金山办公宣布全面升级 WPS Office 的 AI 语音速记功能,为用户提供更快捷、准确的语音转文字体验,并与 WPS 云文档深度融合。这项功能的推出不仅优化了办公效率,还彰显了科技为公益服务的理念。核心功能:提升办公效率WPS AI 语音速记功能为用户提供多场景下的高效服务,支持实时录音与转写、翻译、多语言支持以及自动总结,广泛适用于会议记录、课堂笔记和采访整理等场景。实时录音与转写:用户可通...
全球领先的人工智能技术公司ElevenLabs宣布推出一款全新对话式AI平台,旨在帮助企业更快速、便捷地构建智能语音代理。该平台采用先进的自然语言处理和机器学习技术,将极大提升客户服务和企业效率,满足不同行业对智能语音交互的多样化需求。随着人工智能技术的迅猛发展,语音交互已经成为提升用户体验和业务效率的重要工具。ElevenLabs的新平台为企业提供了强大的功能,支持从语音识别到自然语言处理的全链...
大屏时代(DapingTime.com) 12月4日 消息:阿里云与星纪魅族近日宣布达成战略合作,Flyme操作系统已成功接入阿里巴巴旗下的通义千问大模型。此次合作将进一步推动智能语音助手、智能推荐等AI应用的创新,并为用户提供更加智能、个性化的操作体验。通义千问大模型赋能Flyme智能化通义千问大模型是阿里云推出的一款大规模自然语言处理模型,具备强大的语言理解和生成能力,能够为用户提供更高效的问...
大屏时代 (DapingTime.com) 12月5日 消息 — 科大讯飞近日确认,为华为Mate 70系列手机提供了多项AI技术支持,其中包括备受关注的AI通话摘要功能。这一合作展示了科大讯飞在人工智能技术领域的强大实力,同时也标志着其与华为的战略合作迈上新台阶。AI赋能Mate 70系列,提升用户体验华为Mate 70系列于11月26日正式发布,以九大AI功能为核心亮点,包括AI运动轨迹、AI...
硅谷讯——人工智能巨头OpenAI近日发布了其全新的高端订阅服务ChatGPT Pro,引发业内高度关注。此次更新标志着OpenAI在人工智能推理能力和人机交互领域的又一次重大突破。ChatGPT Pro:高端AI体验的新里程碑ChatGPT Pro订阅月费200美元,旨在为研究人员、企业用户及开发者提供更高级的人工智能工具。Pro用户可无限制地使用OpenAI旗下最先进的模型,包括新推出的推理模...
苹果公司于2024年9月发布了全新的iPhone 16系列,这款手机以深度整合人工智能(AI)技术为亮点,搭载全新AI平台Apple Intelligence,带来更加智能化、个性化的用户体验。作为苹果首次将生成式AI深度应用于智能手机的产品,iPhone 16系列被视为智能手机领域的又一次革新。Apple Intelligence:AI时代的核心亮点iPhone 16系列首次引入了苹果自研的AI...
在过去的一周里,科技行业迎来了一系列令人瞩目的创新突破,涵盖了人工智能、量子计算、增强现实、自动驾驶等多个前沿领域。随着全球科技公司不断加大研发投入,技术进步正在改变各行各业的面貌,塑造未来的科技生态。本文将深入剖析这些热点新闻,探讨它们可能带来的影响与挑战。1. OpenAI推出GPT-5:人工智能迈向新高峰OpenAI在其最新的产品发布会上,宣布推出了GPT-5,这一新一代的大型语言模型被誉为...
过去一周,人工智能(AI)行业持续引发热议,各大公司在技术创新和产品发布方面动作频频。新一轮技术竞赛不仅展现了AI的巨大潜力,也反映出市场竞争的激烈程度。以下是本周AI领域的综合动态盘点。技术与产品创新:突破不断字节跳动推出AI助手“豆包”字节跳动推出了新款AI助手“豆包”,并为其配备了图片理解功能。这款助手旨在优化用户的日常体验,进一步推动字节跳动在AI领域的布局。与此类似,百度旗下的“文心一言...
北京时间周二凌晨2点,OpenAI将迎来第三场产品直播发布会。首席执行官Sam Altman在社交媒体上对即将发布的产品表现出极大的兴奋,并称其为“非常、非常令人期待的东西”。网友们对此反应热烈,纷纷猜测OpenAI可能会推出突破性的产品,甚至有可能是通用人工智能(AGI)。期待中的“第三天惊喜”OpenAI前两天的发布会内容相对中规中矩,主要推出了ChatGPT Pro和强化微调API(o1深度...
发现领先技术的文本转语音工具的力量,它们正在多个平台上彻底改革内容创作和可访问性。从微软无缝的音频合成到谷歌云自然音的音频,每个工具都提供独特的功能,以满足不同需求。释放超过409个声音、多语言支持和AI增强语音合成的潜力,创造出令人沉浸的内容,享受无与伦比的便利。深入体验无忧的文本转语音转换世界,感受未来音频生成的指尖体验。最佳 speech to text apps 在 20241MS Tex...
近日,YouTube 宣布将其人工智能驱动的自动配音功能推广至更多知识类频道。这项创新技术让内容创作者可以轻松为视频生成多语言配音,从而突破语言障碍,触达全球观众。此举标志着 YouTube 在推动知识传播全球化方面迈出了重要一步。AI自动配音:高效、精准、自然YouTube 的自动配音功能采用了先进的自然语言处理和语音合成技术,能够生成多种语言的配音,并确保语音自然流畅。整个过程无需创作者额外翻...
2024年12月16日,清华系AI基础设施创业公司无问芯穹(Infinigence)宣布正式开源其端侧全模态理解小模型 Megrez-3B-Omni,并同步发布其纯语言版本 Megrez-3B-Instruct。此次开源的Megrez-3B-Omni具有强大的图片、音频和文本三种模态数据处理能力,成为端侧智能设备的一项重要技术突破。Megrez-3B-Omni:为端侧设备量身定制的全模态理解模型M...
2024年12月16日,Nexa AI宣布推出全新的OmniAudio-2.6B音频语言模型,专为边缘设备的高效部署而设计。与传统的将自动语音识别(ASR)和语言模型分开的架构不同,OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一的框架中,从而有效消除了传统系统中各个组件链接所带来的低效率和延迟问题。该模型特别适用于计算资源有限的设备,如...