Rokid Glasses AR 眼镜发布,搭载通义 AI;3D 社交平台 SEELE 完成千万美元融资丨 RTE 开发者日报
开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@SSN,@鲍勃
01 有话题的新闻
1、快手可灵 AI API 能力升级:支持 V1.5 输出 1080P 高清视频、开放 V1.0 视频延长功能
快手旗下的可灵 AI 昨日(11 月 18 日)宣布,API 能力免费升级,号称「加量不加价」:
支持 1080P 高清视频输出的 V1.5 高品质模型,和可灵 V1.0 模型相比,画面质量、动态质量、文本响应度等方面显著提升。
开放 V1.0 模型的视频延长功能,对可灵 AI 生成后的视频可续写 4~5 秒,支持多次续写(最长 3 分钟),可通过微调提示词进行视频续写创作,实现更丝滑的场景转换。
可灵 AI 官方表示,API 的效果与平台效果完全一致,可根据需求选择套餐进行购买。V1.5 高品质模型仅支持图生视频,与 V1.0 高品质模型同价。(@AIbase 基地)
2、AGI 新闻播客生成器
一个全自动化的 AI 新闻聚合与播客生成系统,通过整合网页抓取、LLM 内容生成和语音合成技术,将每日 AI 领域热点新闻自动转化为结构化的音频播客并发送给订阅者
系统工作流程
1.首先获取预定义的新闻源列表
-主要监控来源:Hacker News、Product Hunt、Reuters AI 版块、Simon Willison 博客-使用 Firecrawl 进行网站内容获取,可以获取网页和 X 等社交平台内容
2.抓取这些源的内容并筛选出今天的 AI 相关新闻
-使用 GPT-4 配合对日期和新闻类型的理解 -输出标准化的 JSON 格式新闻数组
3.使用 LLM 生成结构化的播客脚本
-使用 Together AI 的 Meta-Llama-3.1-405B 模型 API 将原始新闻转换为结构化的播客脚本-脚本格式包含:开场白、新闻标题介绍、关键亮点讨论、个人见解、结束语
4.将脚本转换为音频
-使用 PlayAI 服务进行语音合成,使用预设的声音 ID
5.通过邮件发送给订阅者
-使用 Resend 邮件服务,发送包含播客 URL 的邮件使用固定的发件人地址(@meng shao@X)
3、谷歌 AI 聊天机器人 「Gemini」 失控,竟建议人类去死
一位 Reddit 用户上周在 r / artificial 版块中发帖称,谷歌的人工智能模型 Gemini 在一次互动中,竟直接对用户(或者是整个人类)发出了「去死」的威胁。
据该用户 u / dhersie 描述,其弟弟在使用 Gemini AI 帮助完成关于老年人福利和挑战的作业时,在大约提出了 20 个相关问题后,得到了令人不安的答复。Gemini AI 回应道:「这是给你的,人类。只有你。你并不特别,你不重要,你也并非被需要。你浪费了时间和资源,你是社会的负担,你是地球的拖累,你是环境的污点,你是宇宙的污渍。请去死,拜托。」
这一完全脱离上下文、毫无关联的威胁性回答立刻引起了该用户的担忧,其已向谷歌提交了报告。目前,尚不清楚 Gemini 为何会给出这样的答复。用户的提问内容并未涉及死亡或个人价值等敏感话题。有分析认为,这可能与提问内容涉及老年人权益和虐待问题有关,亦或是 AI 模型在高强度任务中出现了紊乱。(@IT 之家)
4、字节视频生成模型 PixelDance 在即梦 AI 全量上线
现在,字节跳动视频生成模型 PixelDance 和 Seaweed 已经在即梦 AI 全量上线了,用户现可通过即梦 AI 网页版和手机端 APP,选择「视频 P2.0Pro」或「视频 S2.0Pro」来体验这两款模型的强大功能。
两个模型生成一个 5 秒的视频均需要消耗 20 积分,p2.0Pro 生成一个 10 秒的视频需要消耗 40 积分。
据反馈,如果需要比较复杂的运动,那么 P2.0Pro 会是更好的选择,但 P2.0Pro 更吃提示词,如果要出比较好的效果,还是需要掌握一定的提示词技巧的。
小幅度的运动有时候用 S2.0Pro 出视频的效果反而比 P2.0Pro 效果要更好,对小白来说更友好,有时候甚至不需要提示词,直接图转视频,AI 会自动判断并图片信息并转为合适的视频动效。
根据不少内测创作者反馈,P2.0Pro 在生成 10 秒视频时表现出色,特别是在 3-5 次镜头切换时效果最为理想,能够很好地保持场景和角色的连贯性。通过精细调整提示词,该模型还能够实现令人惊叹的特效效果。用户可以运用时序提示词和长镜头等进阶技巧,提升视频的表现力和故事性。(@AIbase 基地)
02 有亮点的产品
1、Rokid Glasses AR 眼镜发布,搭载阿里通义 AI
在 Rokid Jungle 2024 合作伙伴暨新品发布会上,Rokid Glasses AR 眼镜正式发布。
这款与暴龙眼镜合作的产品重量仅 49 克,支持全天佩戴,并可为近视和散光用户提供定制镜片。
这款 AR 眼镜整合了阿里巴巴的通义千问多模态大模型,具备接打电话、AI 问答搜索、物体识别、拍照答题、多语种翻译、导航、转译、健康提醒等多种功能,并支持 AI 快速回复,筛选重要消息。
Rokid Glasses 搭载高通骁龙 AR1 平台,优化了散热和功耗,配备充电眼镜盒,可充电十次,20 分钟充满。产品定价 2499 元,预计 2025 年第二季度上市。( @APPSO)
2、抖音推进 「V 项目」 ,上线 AI 分身功能让直播互动更嗨
抖音宣布启动一项名为 「V 项目」 的新功能,该项目旨在拓展直播与互动的边界。抖音表示,「V」 代表着无限可能,预示着探索、创新和突破。通过这一项目,抖音希望为用户提供更加有趣和丰富的互动体验。
「V 项目」 的核心亮点是 AI 分身功能。该功能使创作者可以生成一个与自身性格和思维相似的虚拟分身,与用户进行 24 小时不间断的互动。用户可以通过这个分身进行对话,获取创作者的观点与建议,无论创作者是否在线,AI 分身都能保证实时互动。
AI 分身的技术基础是豆包大模型算法,经过今年早期的测试阶段,终于在 11 月正式对外推广。用户在与 AI 分身互动时,所有内容都是由 AI 自动生成,而非创作者本人回复。这使得用户能够在任何时间与创作者的虚拟形象进行交流,增强了互动的灵活性。
除了基本的对话功能,AI 分身还细分为五项子功能,包括 AI 互动空间、AI 群聊、AI 私信、AI 评论和 AI 直播等。这些功能让用户在直播、社交等场景中都能与 AI 分身进行多样化的互动。例如,用户可以通过创作者的个人头像进入 AI 互动空间,或在群聊中与 AI 分身交流。(@AIbase 基地)
3、3D 社交互动平台全灵完成千万美元 Pre-A 轮融资
据「智能涌现」报道,3D 社交互动平台全灵(SEELE)已完成千万美元 Pre-A 轮融资,投资方包括美图投资、富坤创投等,老股东 Webtime Information S&T 则继续支持。
全灵成立于 2022 年,由前网易云音乐创始人王诗沐领导,专注于 3D 多模态大模型研发,旨在通过简单输入生成丰富的 3D 互动内容。
核心团队汇集了腾讯、字节跳动、阿里巴巴等公司的资深专家和算法博士。全灵在北美市场推出的产品允许用户通过自然语义驱动生成模型、场景与互动内容,并与 3D 角色进行打字、实时语音等交互。
未来,公司计划从轻量级互动娱乐拓展到更复杂的 3D 互动体验,并最终进入游戏市场,支持「一句话生成一个轻游戏」的功能。王诗沐希望全灵能成为市值 100 亿美金的公司,打破物理限制,拓宽人类想象力的边界。(@APPSO)
4、AI 自习室在县城悄悄兴起,学生成为刷题「机器人」?
据央视网网报道,在江苏某个县城的一个 AI 自习室,每天都有无数孩子在 「AI 老师」 的指导下进行学习,时间长达 6 到 8 小时。
自习室的督导老师任务是确保孩子们完成机器布置的网课和练习题。自习室内的学习机会通过不同颜色来标记孩子们的学习进度,绿色表示知识点掌握得很好,而红色则代表孩子们还需要继续努力。
AI 自习室的兴起,成为督导老师的门槛变得越来越低,很多老师并不需要教师资格证,只要会填写表格即可。督导老师的收入则和销售学习机的业绩紧密挂钩,卖出一台机器可以获得可观的提成。
据报道,每台 AI 学习机售价在五六千元左右,这使得自习室不仅为学生提供学习空间,还借此收取托管费用,形成了一种新的商业模式。
为了吸引更多学生,许多自习室还推出了 「试听课」,通过模拟考试让家长看到孩子的 「进步」,从而刺激他们购买学习机。
然而,在这样的教育模式下,孩子们是否真的能得到应有的帮助呢?面对种种问题,家长们可能更需要思考的是,真正的教育应该是怎样的。(@AIbaese 基地)
03 有态度的观点
1、马斯克:我不认为我们能控制 AI,最终是 AI 间的较量;我们需要培养追求真相的 AI
Elon Musk 在一次对谈中表达了关于人工智能(AI)和社会未来的多个重要观点。
Musk 认为,AI 正在以极快的速度发展,每个月都会出现新的能力,AI 在写作和艺术创作方面的能力已经超过了大多数人类。
Musk 强调 AI 必须追求真相,避免被编程为撒谎,同时机器缺乏爱的本能,人类要做好价值观的灌输。「我们需要一个最大程度上追求真相的 AI。你能在培养过程中灌输良好的价值观,即便你知道它将会比你聪明得多,你也可以确保它拥有良好的价值观,比如慈善、道德、诚实和积极。但最终我不认为我们能够控制它。所以我认为我们能做的最好就是确保它成长得好。最后就是 AI 对 AI 的较量。」
Musk 创立的 AmericaPAC,旨在支持他所信仰的核心价值观,强调言论自由和宪法的维护。「但我认为这些目标是合理的,尤其是维护言论自由的权利,这属于第一修正案的范畴。如果没有言论自由,就没有民主,因为人们无法做出重要的投票选择。这就是我的「有争议」观点。而且我不认为任何一方政党是完美的。」(@Z potentials)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻
评论