• 宇树科技王兴兴:通用人形机器人最早2026年底实现“自主干活”

    热点聚焦 2025-09-25
    凤凰网科技讯(作者/于雷)9月24日,2025高通骁龙峰会今日举行,在峰会“具身智能的进化思考”对话环节,宇树科技创始人、CEO、CTO王兴兴分享了其对具身智能及人形机器人产业发展的最新思考和判断。他详细阐述了通用人形机器人从当前阶段走向应用的清晰路线图,并指出了当下产业面临的核心技术挑战与合作方向。王兴兴判断,通用人形机器人的发展可以分为几个关键节点。他透露,团队在今年上半年已基本实现去年的规划目标,让机器人能够理解复杂指令并做出丝滑流畅的动作。然而,这仅仅是第一步,因为机器人还停留在执行“固定动作”的阶段,无法自主“干活”。他预测,下一个关键节点是让机器人能够响应实时指令,做出任意它能力范围内的动作,这一目标快则今年年底,慢则明年上半年有望解决。在此基础上,真正的突破将是让机器人能够在完全陌生的环境中,自主理解指令并与物理世界进行任意交互,例如被告知“我渴了”后,能自行在家中找到水杯并递过来。“如果快的话,明年年底,或者后年,这种场景就有可能实现”,王兴兴表示,那将是具身智能接近实现的时刻。更长远的目标,则是将机器人的任务成功率提升至99.9%以上,并能完成拆装手机等精细化操作,这可能还需要数年时间。在谈及实现这一目标的挑战时,王兴兴特别强调了终端侧的算力与功耗问题。他指出,将类似高端显卡这种动辄200、300瓦功耗的部件置入空间有限的人形机器人体内是“没办法入手”的。高功耗不仅会迅速耗尽电池,其巨大的散热需求对于小型机器人来说更是难以逾越的障碍。因此,他提出了一个明确的技术指标:“通用人形机器人未来的终端算力,功耗最好控制在100瓦以内,平均正常功耗可能只有20、30瓦”,这使得功耗与散热表现优异的手机类芯片成为极具潜力的解决方案。此外,一个常被外界忽视却至关重要的领域是机器人的通信与线缆。王兴兴将线缆比作机器人的“血管”,并指出其可靠性是决定机器人稳定性的核心。他以工业机器人为例,称至今最常见的故障依然是线缆问题,可能占到整体故障的60%以上。因此,通过新的通信协议和架构设计,大幅减少机器人内部线束数量和复杂性,是提升机器人整体可靠性的重中之重,其重要性不亚于汽车产业的电子电气架构革新。面对当前全球具身智能领域技术路线“百家争鸣”的现状,王兴兴认为整个行业正处于爆发前的“黎明时分”。他呼吁产业各方,包括芯片厂商、操作系统开发者及算法公司,都能保持更加开放的态度。他透露,其团队近期已将一个自研的视觉相关模型连同数据集、训练代码一同开源,希望以此带动更多人参与共同解决难题。他最后表示,具身智能的发展需要整个产业链的协同努力,从更安全的机器人操作系统,到统一的通信协议,再到完善的供应链体系,每一个环节的进步都将加速产业的爆发。来源:凤凰网科技
  • 手机厂商纷纷押注端侧大模型,AI手机或成未来新潮流?

    热点聚焦 2024-03-12
    智能手机市场潮流的演变总是瞬息万变。曾几何时,苹果手机是时尚潮流的代名词,新品一经发布便引起万人空巷,但近年来国产手机凭借其敏锐的市场洞察力和强大的研发实力,不断创新以满足市场的变化,逐渐在市场上占据了一席之地。智能手机行业进入存量时代,各厂商都在寻求新的创新点。而AI的到来,成为重要催化剂。随着人工智能技术的不断发展,端侧AI大模型已经成为了当前手机行业的一个重要竞争点,这也为国产手机带来了新机会。在技术赋能下,手机厂商持续发力AI领域,为中国手机行业及消费者带来全新的AI体验。AI大模型落地手机端,成厂商必争之地近期,OPPO发布Find X7系列产品。据悉,OPPO Find X7是全球首个端侧应用70亿参数大语言模型的手机,并且通过端云协同的先进部署,带来全新的AIGC消除功能与首个AI大模型语音摘要,为消费者带来超过100种智慧能力,为日常生活的方方面面提供高度实用的下一代 AI 体验。此前在2023年11月举行的OPPO开发者大会上,OPPO宣布在最新发布的Color OS14中,内置了“安第斯大模型”(AndesGPT)。据了解,该模型包含了从10亿到千亿不同参数规模的多种模型,并将与自研的潘塔纳尔智慧跨端系统全面融合。无独有偶,同一时间段,vivo在开发者大会上发布了自研的AI“蓝心大模型”,一个月后,vivo正式发布vivo S18系列手机,vivo S18系列首批搭载AI“蓝心大模型”,支持用户查找文件、作诗写词、看文创图、总结内容、解答难题、整理材料框架等。OPPO跟vivo如此“给力”,同为国产手机的华为怎么能没有动作?早在去年7月,华为在开发者大会上发布了“盘古大模型3.0”,同年8月,华为官宣新一代智能操作系统Harmony OS4已接入了盘古大模型。此外,布局端侧为主的AI大模型手机厂商还有荣耀、小米。1月10日,荣耀在MagicOS 8.0发布会及开发者大会上正式发布了MagicOS 8.0操作系统以及自研的70亿参数端侧AI大模型“魔法大模型”。据介绍,在“魔法大模型”支持下,MagicOS 8.0将带来智慧成片、图库语义搜索、一拖日程、任意门等功能,“任意门”可以基于对用户真实意图的快速理解,一键穿越不同应用,实现多任务的快速闭环,带来全新的人机交互体验,打破系统、服务、设备与人之间的边界。1月11日发布的荣耀Magic 6 手机首发搭载“魔法大模型”及MagicOS 8.0。另一位选手小米也在2023年10月宣布自研AI大模型“MiLM-6B”已经接入小米澎湃OS。小爱同学在AI大模型的加持下,拥有了文本创作、AI扩图等能力。手机厂商加码比拼,端侧AI大模型有何魅力?如今,智能手机的潮流趋势正呈现出多元化、个性化的特点,随着手机硬件和软件的升级,用户对手机的性能和体验期待也日益提高。端侧AI大模型的诞生,使得手机能够更智能化地满足用户需求,优化用户体验。借助端侧AI大模型,手机可以做到更精准的图像和语音识别,使操作更加简便,有效解决生活和工作中遇到的问题。手机智能化程度不断提高的同时也意味着手机面临的安全威胁也越来越多。端侧大模型基于个人化理解和感知来完成场景化任务闭环,可以更好地学习用户个人数据,且个人数据不出端、不上云,隐私信息更安全,总体看来端侧AI大模型可以在一定程度上增强手机的安全性。数据显示,到2025年中国人工智能核心产业规模将增至4000亿元。在数据量爆发式增长、深度学习算法优化改进与计算能力大幅提升的情况下,人工智能核心产业规模呈现快速增长趋势,2030年有望达到10000亿元。  人工智能所带来的机器学习和深度学习技术在网络安全产品的身份识别、智能化检测网络威胁等方面发挥重要作用,为网络安全产业高质量发展提供新动力。通过端侧AI大模型,手机可以实现人脸识别、指纹识别等生物特征识别技术,这些技术可以更好地保护用户的隐私和安全。  在移动互联网的不断发展下,手机需要处理的数据量也越来越大,端侧AI大模型具有极高的计算能力和处理能力,可以实现更高效的计算和数据处理。例如,在图像识别和语音识别方面,端侧AI大模型可以更快地处理数据,并且能够更好地识别各种信息和指令,从而让用户更加便捷地完成各种操作。未来,随着终端设备的计算能力和数据处理能力的提升,端侧大模型的应用场景将会更加广泛。  端侧大模型处发展初期,未来仍需创新在手机上使用AI大模型并不是新鲜事,Chat GPT、文心一言、讯飞星火、通义千问等通用大模型都推出了App版本,允许用户在移动端体验。但App依赖的均是云端大模型,需要调运服务器算力并进行数据传输,因此也存在成本和安全问题。除了成本,还有安全问题需要考虑。用户手机中有大量隐私数据,如个人信息、金融信息、照片视频等,这些一旦发生泄露,将对用户产生极大影响。这也导致了尽管手机厂商纷纷布局大模型,但成功落地手机之路困难重重。因为大模型的参数量对应着大模型能力的体现,目前云端的大模型参数量已达千亿级别,而手机端最高参数规模仅为70亿(参数量是当下大模型中最重要的指标,参数量越大,大模型能力越强)。艾媒咨询CEO兼首席分析师张毅在接受《证券日报》记者采访时表示,2024年,AI可能成为手机新的卖点,尤其是手机的社交价值功能呈现方面,将有更多的故事可讲。对于手机厂商而言,AI大模型是公认的未来发展赛道和方向,尽管现在AI在智能手机终端的应用仍较为初级,但未来的普及和推广仍值得期待。从多个厂商的布局来看,端侧AI大模型是当前手机行业的一个重要竞争点。随着人工智能技术的不断发展,端侧AI大模型将会在移动终端设备上发挥越来越重要的作用。通过提高用户体验、增强手机安全性、实现更高效的计算和数据处理以及推动人工智能技术的不断发展等方面的影响,端侧AI大模型将会成为未来手机行业的一个重要趋势。对于手机厂商而言,AI大模型落地手机端仍处在一个摸索的阶段,但他们几乎都认为,将大模型装入手机是一场“未来之战”。文章来源:手机厂商纷纷押注端侧大模型,AI手机或成未来新潮流?
  • OpenAI发布创新文生视频模型Sora

    热点聚焦 2024-02-19
    近期,位于美国旧金山的OpenAI再次引起了全球的关注,发布了其首个文生视频模型——Sora大模型,实现了从文本描述到高质量视频的转变,为AIGC带来了新体验。随着国家政策的倾斜和5G等相关基础技术的发展,中国人工智能产业在各方的共同推动下进入爆发式增长阶段,市场发展潜力巨大。数据显示,2020年中国人工智能核心产业规模就已达1500亿元,预计在2025年将达到4000亿元,未来有望发展为全球最大的人工智能市场。而AIGC的存在,将会极大释放人类的想象力,掀起属于这个时代的“新艺术浪潮”。Sora模型的出现,打破了传统视频制作的局限,使得通过文本描述生成高质量视频成为可能。据悉,Sora模型可以接收文本描述,然后自动生成60秒长的视频。更为神奇的是,这款模型还能精确理解文本中的色彩风格等要素,创造出人物表情丰富、情感生动的视频内容。在AIGC领域,Sora模型的发布推动了AI多模态领域的飞跃式发展,使得AI创作等相关领域将迎来深度变革。未来,AI的赋能范围将进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。对于OpenAI来说,Sora模型的发布不仅是对其技术实力的再次证明,也是对其使命——创建造福全人类的安全通用人工智能(AGI)的坚定承诺。自2015年底成立以来,OpenAI一直在努力推动人工智能技术的发展,以期为人类带来更大的福祉。尽管在初期面临了资金链断裂的风险,但OpenAI凭借其独特的视角和坚定的信念,成功逆袭成为引领通用人工智能浪潮的领军企业。值得一提的是,OpenAI与微软之间的紧密合作关系也为Sora模型的发布提供了强大的支持。自2019年起,微软与OpenAI建立了合作伙伴关系,成为其最大的投资者,拥有49%的股份,这种深度的合作不仅为OpenAI提供了稳定的资金支持,还使其在云计算、AI技术等领域取得了显著的进步。
  • AI、真人傻傻分不清楚?TikTok推出AIGC内容标签功能,不打标签将被删

    热点聚焦 2023-09-26
    海外短视频平台TikTok近日已经全面启动平台AIGC内容的监管。TikTok推出了一种标记AI生成内容的新功能,将提示创作者打开标签功能,以便让观看者知道视频和照片是使用AI软件创建的。TikTok一直以来以其独特的内容创作方式而闻名,用户可以通过上传视频、添加音乐、特效等元素,创作出各种各样的短视频。然而,近年来,人工智能技术的快速发展使得AI生成的内容也逐渐成为了TikTok上的一部分。这包括通过AI生成的虚拟角色、自动合成音乐、智能特效和滤镜等。数据显示,预计2023年中国AIGC行业核心市场规模为79.3亿元,2028年将达2767.4亿元。随着人工智能技术的不断发展,AIGC技术也将日益成熟,未来将在更多领域得到广泛应用,巨大的应用前景将推动AIGC市场规模快速增长。AI在TikTok上的应用带来了许多有趣和创新的内容,但也引发了一些潜在的问题。首先,一些观众可能无法确定一个视频或照片是否是由人工智能生成的,这可能会对内容的可信度产生负面影响。其次,一些创作者可能借助AI生成内容来获取更多的关注和粉丝,这也引发了关于公平竞争和创作道德的争议。为了应对这些问题,TikTok最近推出了一项新功能,即标记AI生成内容。这一功能旨在提高内容的透明度,让观众能够清晰地辨认出哪些内容是由人工智能生成的。创作者可以选择打开标签功能,以明确他们的视频或照片中使用了AI技术。这项举措的好处在于,观众可以更容易地识别出AI生成的内容,从而更好地理解和评估它。这也有助于创作者们建立更加诚实和透明的内容创作方式,增加观众的信任度。此外,TikTok还计划在本周测试一种自动将内容标记为AI生成的方法,这将进一步提高内容的可辨识度。TikTok的新举措旨在提高内容的透明度,让观众更容易地辨认出AI生成的内容。这对于维护内容创作的诚实和透明至关重要,有助于建立更健康和可信赖的内容生态。然而,这也引发了关于AI在内容创作中的角色和道德问题,需要平衡创新和透明度之间的关系。未来,随着AI技术的不断发展,TikTok和其他社交媒体平台将不断面临这些挑战,如何找到适当的解决方案来应对,将是TikTok之后需要长期思考的问题。新闻来源:艾媒网