欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解
腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。多位腾讯员工表示,他们最近收到了内部邮件邀请,可以通过网页或小程序体验混元大模型。腾讯内部多个业务也已经接入混元大模型进行测试。
吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。目前,美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。
DragonDiffusion 是一款基于扩散模型的图像编辑工具,旨在实现对图像进行精细化编辑。通过设计分类器引导的方法,DragonDiffusion 能够将编辑信号转化为梯度,通过特征对齐损失修改扩散模型的中间表示。
余承东在社交平台展示了一项新技术:他利用华为手机内置的小艺语音助手,写了一段发布会宣传文案。从该视频可以看出,小艺可以根据用户需求,自动生成文案等内容。而在小艺的回答下方有一行提示——“数据来源:由AI模型自动生成,可能存在疏漏,仅供参考”。华为鸿蒙4.0或将融入AI大模型的能力,使得小艺语音助手具备生成式AI的功能。
阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对线B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。
多个AI相关App在苹果应用商店下架。据七麦监控数据显示,本次共有658款应用被下架,其中包含 Chat、AI、GPT 等关键词的应用较多。根据苹果官方通知,中国区的苹果应用商店不允许提供 ChatGPT 相关的服务。同时,相关开发者需提供专门的许可证,且需要向监管部门申请。
百度智能云千帆大模型平台已经完成了新一轮的升级,全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型,成为了国内拥有大模型最多的平台。
百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证,部分功能有望在长城、领克、smart等量产车型上率先落地。
互联网大厂百度已经实现了将其大型语言模型 ERNIE 应用于汽车领域的承诺,并与汽车制造商长城汽车和数字驾驶舱创造者 ECARX 展开合作。
10.淘宝AI装修功能“真能造”将全面上线月下旬内测的AI装修功能“线日的家装家居生态峰会上正式对外发布,届时功能将更加完善,并且在样板间UGC分享和用户交互功能等方面进一步迭代升级。
阿里云通义听悟近期上线了三大新功能,其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,从而提高职场人士和学生的工作学习效率。
:科大讯飞在投资者平台回应称,讯飞星火认知大模型V2.0升级发布会将于8月15日举办,届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。
《生成式人工智能服务管理暂行办法》将在8月15日起施行,《办法》明确,提供和使用生成式人工智能服务应当尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。
AI游戏教育与产业联盟专委会正式成立。浦东将在产业政策、运营规范、国际交流等方面,为AI和游戏产业的发展提供大力支持。
苹果公司在2023年度的研发上花费了226.1亿美元,首席执行官蒂姆·库克明确表示其中一部分支出是因为该公司正在开发生成式人工智能。库克表示:「多年来,我们一直在进行广泛的人工智能技术研究,包括生成式人工智能。我们将继续投资、创新,并以负责任的方式推进这些技术,以帮助丰富人们的生活。显然,我们在大量投资,并且这一点在你所看到的研发支出中得到了体现。」
国外知名博客门户网站最近宣布,他们将禁止100% 由人工智能(AI)生成内容的发布,坚称平台为 “人类写作的家园”。Medium要求所有 AI 生成的文本都必须在 Medium 上进行标注,否则将不会被展示
Elon Musk 疑似已经从 OpenAI 手中购买了域名 AI.com,将其用于他即将成立的 AI 公司 xAI。分析认为,此举可能是为了让自己的公司成为 AI 领域的中心,与 OpenAI 竞争。
澳大利亚新闻集团(News Corp Australia)执行主席Michael Miller透露,该公司每周使用生成式人工智能制作3000篇文章,生成数千个有关天气、燃油价格和交通状况的当地报道。最近,该新闻集团发布公告招聘生成式AI数据记者,要求会使用AI自动创建新闻内容。这在新闻领域属于比较新鲜的职位,同时新闻媒体的内容创作将迎来转型时期。
ChatGPT的开发者OpenAI已经向美国专利商标局(USPTO)提交了“GPT-5”的商标申请。这一消息是由商标律师Josh Gerben在推特上分享的。GPT-5被推测是OpenAI高级
测试中使用人工智能总结视频谷歌正在尝试使用人工智能自动生成 YouTube 视频摘要。这些摘要只会出现在有限数量的英语视频旁边,并且只能由有限数量的用户观看。它们将出现在 YouTube 的观看和搜索页面上,旨在简要概述视频内容,而不取代人工编写的现有描述。
OpenAI 可能正在准备下一版本的 DALL-E AI 文本到图像生成器(称为 DALL-E3),并进行一系列 alpha 测试,这些测试现已向公众泄露 。虽然测试版本显示了模型的潜力,但也暴露了一些潜在的问题,例如生成不适宜内容的风险。然而,这些问题有望在正式发布之前得到解决。
硅谷风投公司 Andreessen Horowitz 最近在开发者网站 GitHub 上发布了一份详细的指南,教人们如何从零开始构建一个 AI 伴侣机器人。Andreessen Horowitz在描述中写道:这些伴侣有很多可能的用例——浪漫(人工智能女朋友/男朋友)、友谊、娱乐、辅导等。该项目纯粹是为了成为开发者教程和入门堆栈那些对聊天机器人是如何构建感到好奇的人。
Kickstarter 近日宣布,对于使用生成式人工智能(AI)工具创作图像、文本或其他作品的项目,将要求其在项目页面上披露更多与 AI 相关的信息。
谷歌科学家使用 GPT-4聊天机器人来欺骗 AI-Guardian 图像分类器的防御措施,并提供了相应的代码。GPT-4成功击败了 AI-Guardian 的防御,并降低了其稳健性从98% 到8%。
Instagram正在开发新的AI功能,包括一个AI生成的图像检测器。这些新的生成式AI功能不仅可以提升用户在 Instagram 上的体验,还可以帮助打击虚假信息。
Stack Overflow 在开发者社区和人工智能之间进行了整合,推出了 OverflowAI。OverflowAI 引入了语义搜索,通过矢量数据库提供智能的响应,为开发者提供准确的问题解决方案。
研究表明,对于类似 OpenAI 的服务,由于计算成本的计量和计费方式,英语输入和输出比其他语言要便宜得多,其中简体中文的成本约为英语的两倍,西班牙语为英语的1.5倍,而掸语则要贵15倍。
谷歌推出了 Robotics Transformer2(RT2),这是一个视觉-语言-动作(VLA)模型,可以将文本和图像输出为机器人动作。谷歌表示,RT-2「让我们更接近机器人的未来。」「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样,RT-2通过从网络数据中传输知识,以指导机器人行为,」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句线能够与机器人交流。」
Adobe 正在构建 Firefly,其生成式 AI 模型系列,在 Photoshop 中加入了一个功能,正如该公司所描述的:「将图像扩展到原始边界之外」。这个名为「生成式扩展(Generative Expand)」的功能,在 Photoshop 的 beta 版本中可用,用户可以通过单击和拖动裁剪工具来扩展和调整图像,从而扩展画布。
Meta发布了一款开源人工智能(AI)工具AudioCraft(直译为音频技艺),该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼线.图像编辑工具EditAnything:可编辑图像中的任何元素
EditAnything 是一款基于 Segment-Anything、ControlNet、StableDiffusion 等技术的图像编辑工具。它能够编辑和生成图像中的任何内容,包括对图像中的物体进行修改、添加、删除等操作,通过调整细节和布局来生成不同风格的图像。
Faceswap.dev 是一个免费开源的AI 换脸软件,可以在视频或图片中进行人脸替换。该软件旨在提供易于使用、高效、安全的 Deepfakes 工具,并致力于提高用户的道德和法律意识,防止滥用 AI 换脸技术。
香港大学计算机视觉与机器智能实验室(CVMI Lab)和 TCL AI Lab 的研究人员共同开发了一种名为 MarS3D 的轻量级模型,可以显著提升自动驾驶 AI 的物体运动状态判别能力。
Nvidia 研究人员推出了一种创新的文本到图像个性化方法,称为Perfusion。与大AI图片生成模型不同的是,Perfusion 只有100KB大小,训练时间短,只需要4分钟。
Deep Nostalgia 是一项使用机器学习来动画静态图像的技术,能够给照片中的人脸添加动画效果,让家族历史更生动。用户只需上传照片,Deep Nostalgia 就会应用预设的动作模板,创建高质量逼真的视频。目前该工具已完成超过1.06亿个动画,并持续增加。
Playground AI 是一款免费在线的绘画工具,不需要注册。用户可以每天绘制1000张作品。
Skybox AI 是一款由 Blockade Labs 开发的免费工具,可以一键生成360度全景图像。用户可以通过关键词描述来生成完整的3D 场景,包括建筑物、天空、地面、植被等。生成的场景逼真,并且用户可以通过手势工具在360度内切换视角,并免费下载图片到本地。
FraudGPT 是一种不受监管的聊天机器人,在暗网上流通,并被犯罪分子用来编写网络钓鱼电子邮件和开发恶意软件。这个软件是由名为 CanadianKingpin 的开发者提供,在多个暗网市场上销售。它的定价为每月200美元,但购买三个或六个月的订阅可以获得折扣,购买一年的访问权限需要1700美元。据称,称其已在地下平台上处理了3000多笔销售。
Do Not Pay 是由 GPT4支持的人工智能律师机器人,可以通过为停车罚单辩解、协商交易退款和分析财务交易来帮助用户节省金钱。其接受了西方主要国家消费者法律和法规的培训,可以撰写引用具体立法的有说服力的信件,并代表用户通过电子邮件发送给公司,从而为他们节省金钱。该机器人已在纽约和伦敦推翻了16万多张停车罚单。
Github官宣,Copilot模型升级,5年内80%的代码将自动生成。GitHub Copilot发布还不到两年, 就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。
1.尽管巴菲特对ChatGPT感到惊叹,但他对AI投资仍持谨慎态度沃伦·巴菲特在接受 CNBC 采访时表达了对人工智能和 ChatGPT 的谨慎而又惊叹的态度。他承认自己对人工智能的了解还不足以对其进行投资,但他仍然看到了它在日常应用中的潜力。
根据调查,63% 的人担心使用生成式人工智能时侵犯版权问题,而41% 的人担心这些工具存在固有偏见。另外,83% 的人对需要跟上的工具数量感到困惑,92% 的人不相信科技公司能够进行自我监管。
苹果分析师郭明錤在新报告中指出,目前没有任何迹象显示苹果会在2024年推出生成式AI技术或将其结合至硬件。郭明錤预测,苹果不会在即将到来的财报电话会议上花太多时间去讨论 AI 相关事项。苹果内部已经在做类似GPT的产品,但对于如何将生成式AI技术应用至消费者产品,苹果仍未有清晰的策略。
IBM安全部门的2023年数据泄露成本报告提供了有力证据,证明投资人工智能、自动化和威胁情报可以缩短数据泄露的生命周期,降低数据泄露的成本,并在整个公司范围内建立更强大、更有韧性的安全姿态。
皮尤研究中心的一项发现显示,19% 的美国工人从事与人工智能高度「暴露」的工作,该研究使用了暴露一词,因为尚不清楚人工智能的影响是积极的还是消极的。最受影响的群体包括预算分析师、数据录入员、税务编制员、技术作家和网络开发人员等职业。但23% 的美国工人却几乎不受影响,这些岗位是人工智能无法轻易复制的一般体力劳动,比如理发师、洗碗工、消防员、管道工、保姆等。
的 Markets Live Pulse 调查中,514位受访者中的77% 计划在未来六个月内增加对科技股的投资或保持现状。与此同时,不到10% 的人认为科技领域的泡沫很快就会破裂。一半的人不愿意自掏腰包购买 AI 工具来帮助他们的个人或业务生活,而大多数公司也没有计划在交易或投资中使用这些工具。
的报告,2023年全球在客服中心技术、对话式人工智能和虚拟助手方面的支出预计将达到186亿美元,这与上一年相比的大幅增长16.2%。
研究显示,2021年全球人工智能芯片组市场估值约为455亿美元,该市场2022年至2031年,复合年增长率可能高达31.8%,到2031年,市场规模可能达到7174亿美元。
1.每月200美元便可 AI“刀”人?无技术门槛的黑客版 ChatGPT 风靡暗网近日,一款名为 FraudGPT 的恶意 AI 工具在暗网上流通,被黑客用于编写钓鱼邮件和开发恶意软件。与传统黑客工具相比,FraudGPT 更简单、直接、高效,无论专业开发人员还是小白都能使用。它可以生成看似真实的钓鱼邮件和网站,诱骗用户泄露敏感信息,还能模仿人类对话,与用户建立信任,引诱他们泄露信息或执行有害操作。FraudGPT 基于 GPT-3的大型语言模型,在训练后可以生成合乎逻辑且与事实相符的欺诈性文本。
前特斯拉总监、OpenAI 大牛 Karpathy 表示,AI 智能体是未来发展的方向。智能体是大模型的 身体,能在各个领域施展身手。国内团队也在发展智能体,联汇科技推出了基于大模型自主智能体 OmBot。智慧店长、文档处理、视频剪辑是智能体的主要应用场景。然而,智能体的商业化落地仍面临挑战,包括技术壁垒和 “松耦合” 路线。国内团队需要攻克这些难题,才能实现真正意义上的智能体。
3.被卖家追着跑,这一波AI商拍线年年末,OpenAI 推出 ChatGPT,引爆了 AI 商拍领域的热潮。AI 商拍工具通过利用 AI 技术帮助品牌生成高质量产品图片,节省了拍摄成本和时间。在静态产品图生成功能上,各产品的使用路径和功能相似,但还需在细节上做更多优化。AI 商拍工具的技术壁垒并不高,不同厂商采用不同的底层模型,如 WeShop 采用了开源的 Stable Diffusion。目前主要用户是中小卖家和档口卖家,大企业在融合 AI 产品方面还面临一些难题。
电影《芭比》票房飙升后,“芭比 AI 写真” 成为热门周边。通过名为 “45AI” 的小程序,用户上传照片后,花9.9元即可得到金发芭比写真。虽然有排队时间和成片效果等问题,但仍有很多人追捧。AI 写真小程序在社交媒体迅速走红,但也引发了争议,如用户隐私等问题。AI 写真被称为抢走摄影师饭碗,但摄影师认为 AI 写真还不能威胁到他们的生意,因为 AI 只能修图,而摄影师还有沟通和引导客人等重要环节。
AI初创公司Runway宣布,AI视频生成产品Gen-1和Gen-2已全面开放,任何人都可以注册一个账号免费尝试。通过使用 Gen-2和 Midjourney,创作者可以快速生成各种类型的短片,包括科幻、恐怖、以及对热门 IP 的二创等。具体玩法可阅读原文。
硅谷在人工智能领域获得了大量融资,但与中国的 AI 创业环境存在差异。硅谷重视技术创新和大模型能力,而中国更注重商业模式。目前硅谷投资热点主要集中在基础大模型层、中间层和垂直应用层。然而,硅谷的大模型公司主要以 OpenAI 为首,其他创业公司很少涉足该领域。相比之下,中国的 AI 创业者和投资人面临迷茫,且 “Copy to China” 的策略逐渐失灵。硅谷投资人更注重 OpenAI 和 B 端行业整合的 AI 公司,而中国的创业者和投资人应该注重发展中间层和独特的商业模式。
查看更多相关信息
阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对线B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。今年4月,阿里云正式宣布推出大语言模型通义千问,支持多轮对话,文案创作,逻辑推理,多模态理解,多语言支持。旗下所有产品未来将接入“通义千问”大模型。
阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对线B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。这次的开源也让阿里云成为国内首个加入大模型开源行列的大型科技企业。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇还表示,阿里巴巴所有产品未来将接入通义千问”大模型,进行全面改造。
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。Part1动态[国内要闻]网易有道发布“子曰”大模型可为学生提供个性化分析指导网易有道正式发布垂直教育行业的大模型“子曰”。这一系列裁员消息引发了关于AIGC行业裁员潮的猜测。
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。Part1动态[国内要闻]1.《生成式人工智能服务管理暂行办法》发布《生成式人工智能服务管理暂行办法》于2023年8月15日起施行。像WestlakeMindworks这样的公司,这些公司正在致力于开发具有长期记忆和高级情绪分析功能的人工智能。
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。Part1动态[国内要闻]1.腾讯音乐推出AI社交APP“未伴”腾讯音乐旗下一款名为“未伴”的AI社交APP在近期开启测试。数据还显示Python和JavaScript是人工智能开发中常用的编程语言。
ChatGPTWeCom是一个基于GO语言实现的企业微信应用,可以将GPT机器人集成到企业微信中。它具有以下特点:-支持单聊和串聊模式:可以进行一对一的对话或带上下文的对话。通过以上特点,ChatGPTWeCom提供了一种方便且个性化的方式,将GPT机器人集成到企业微信应用中,提供更好的用户体验。
核心频率不同,CPU型号不同天玑9200+和天玑 9000 都是联发科的5G旗舰级芯片,天玑9200+和天玑9000都是采用台积电4nm工艺制程。天玑9200+的CPU最高主频为3.3GHz,而天玑 9000 的CPU最高主频为3.2GHz。两款芯片都支持双模5G、WiFi 6E和蓝牙5. 2 等技术。
第二代骁龙 8,LPPDR5X+UFS4.0,2K三星E6 材质Super AMOLED屏幕魅族 20 Pro,内置第二代骁龙 8,LPPDR5X+UFS4.0,搭载了2K三星E6 材质Super AMOLED屏幕,屏幕尺寸6. 81 英寸,支持120Hz自适应屏幕刷新率和1500Hz瞬时触控采样率,峰值亮度可达1800nit,屏幕还通过了SGS抗蓝光、抗频闪护眼认证;破晓灰、曙光银、朝阳金三种配色,整机厚7. 8 毫米,重 209 克;镜头模组由 5000 万像素人像镜头、 5000 万像素广角镜头、 5000 万像素超广角镜头组成,支持全像素对焦技术搭配dTOF辅助对焦,官方称将使对焦速度提升33%。魅族20 系列的主摄均支持SMA防抖,最高8K视频录制和夜景录像功能;5000mAh电池配80W快充,支持50W无线GB三种存储组合,售价 3999 起。
后置三摄,主摄 5000万像素,屏幕分辨率2496*2224华为Mate X3有「羽砂玻璃版:羽砂白、羽砂黑、羽砂紫」、「素皮版:晨曦金、青山黛」五款配色可选;覆盖昆仑玻璃;超轻薄折叠四曲设计,机身重量仅239g,厚度仅5.3mm, IPX8级抗水。屏幕拥有2496*2224超高分辨率和426ppi 超高像素密度。同样支持最高120Hz 自适应刷新率以及1440Hz PWM 调光。影像方面:搭载5000万像素超感知主摄,1300万像素超广角镜头,1200万像素潜望式长焦镜头。并配备10通道多谱传感器和激光对焦传感器,支持100倍变焦和5倍光学变焦。续航方面:配备4800mAh 大电池,支持50W 无线W 有线W 无线反向快充。性能方面:与华为 P60系列一样搭载了骁龙8+ 处理器,配备了超冷跨轴石墨烯散热系统,导热面积提升了20%。价格:华为Mate X3:256GB:12999、512GB:13999;华为 Mate X3典藏版:1TB:15999
6. 67 英寸的OLED屏幕, 4800 万像素长焦镜头华为P60 系列在背部采用了矩阵型模组,官方称之为“凝光设计”,引入了“凝光贝母”工艺;华为P60 全系搭载了6. 67 英寸的OLED屏幕,拥有2700* 1220 刷新率,显示效果十分细腻,支持10. 7 亿色、1440Hz PWM调光。 同时支持全局色彩管理,支持莱茵专业色准双重认证;屏幕还支持LTPO动态高刷新率,支持1~120Hz自适应刷新率,还配备了昆仑玻璃面板,IP68 防尘抗水;相机方面,华为P60 Pro则进一步升级长焦镜头,配备了 4800 万像素RYYB的超聚光夜视长焦镜头,支持3. 5 倍光学变焦、OIS,拥有F2. 1 超大光圈;支持双向北斗卫星通信;5100 毫安时大电池+88W快充;首发搭载了全新的鸿蒙3.1,新增了AOD息屏显示功能。
6.67英寸的OLED屏幕,支持1~120Hz的LTPO刷新率华为P60 系列的屏幕搭载了骁龙8+ 4G处理器,6. 67 英寸的OLED屏幕,支持1~120Hz的LTPO刷新率,支持1440Hz PWM调光,拥有10. 7 亿色、全局P3 色域、HDR-P3HDR Vivid显示效果;覆盖四曲昆仑玻璃,支持IP68 防水,是全球首款德国莱茵专业色准双重认证的手机;相机方面,华为P60 支持F1.4-4. 0 十档可变光圈,搭载大光圈高透光镜群和RYYB超感光传感器,支持了华为XD Fusion Pro质感引擎;支持双向北斗卫星消息;首发搭载鸿蒙3.1,支持AOD息屏显示;价格,华为P60 的128GB版 4488 元,256GB版本是 4988 元,512GB版本是 5988 元。
天玑9000芯片,LPDDR5+UFS3.1,11.61英寸LCD屏幕,支持144Hz刷新率OPPO Pad2主要配置包括:11.61英寸7:5比例LCD显示屏,拥有2800×2200分辨率和500尼特亮度,支持144Hz五档刷新率智能调节,2048级亮度自适应智能调光并支持手写笔。OPPO Pad2基于联发科技天玑9000,辅以LPDDR5内存和UFS3.1存储,内置9510毫安时电池、67W有线万像素前置摄像头和蓝牙5.3。软件方面,ColorOS13.1支持5G通信共享。可以自动共享手机的5G通信,从而直接上网、接打电话、同步手机验证码、拍照流转和应用接力。
5G双待双通(DSDS)、WiFi 6/6E、蓝牙5.3等骁龙7+ Gen2 采用了骁龙X62 5G调制解调器,在全球范围内支持多种频段和模式的5G网络连接。它还是首款在骁龙 7 系中实现了5G双待双通(DSDS)功能,在两张SIM卡都插入时可以同时使用两个不同运营商或不同网络制式(例如SA和NSA)的5G网络服务。除此之外,它还支持WiFi 6/6E和蓝牙5. 3 等无线技术。
*请认真填写需求信息,我们会在24小时内与您取得联系。