跳转至内容

大模型、智能体以及通用智能(AGI)

聚焦大模型、智能体与AGI前沿,探索智能边界,共谋技术未来。

您可以通过 agi&LLM@bbs.ailabx.com 标签在开放的社交网络上关注这一版块。

6 主题 10 帖子

子版块


  • 知其然,知其所以然。
    transformer驱动的暴力美学。

    1 1
    1 主题
    1 帖子
    A
    哪些人是例外? 如果你还没有毕业,为了发论文尽快毕业,那该练还是得练,还要变着花样练。 如果你是全栈的超级个体,能解决数据、模型、推理和资金等全链路,那么请勇敢冲浪。 AI时代缺你真的不行,因为这样的团队我周围也见过好几个,比如Doc2x和Simpletex。 除此之外,我想象不到个人和小团队还有什么理由去训练大模型。 2. 不训练大模型怎么办? 这里有以下几个常见问题: 2.1 企业的一些私有数据,不能调用外部的API,不训练怎么办? 答:做好开源LLM+RAG的部署。 在没有触及RAG的性能边界之前,不要微调模型(这个观点有争议,先抛出来供批判)。 现在的开源LLM只有权重,没有数据。你做领域微调的时候,由于没有配比原始数据,微调之后的结果,极有可能比原本的更差。 但稍微良心一点的开源LLM,对RAG的支持都还是可以的,你只需要把RAG的信息提前找好就可以了。 常见的一个方案就是,对一些图片or PDF文件做好OCR,转为Markdown,不管是graphRAG也好,还是传统的ES搜索,在每次问答前,将需要的上下文,塞给LLM,拿到的结果就不会太有问题。 再次重申一个冷知识:如何让LLM输出正确答案?在输入的时候告诉它。 此外,RAG自带在线持续学习的特性,非常适合业务场景。目前很难让LLM的权重随着业务场景的变化而实时更新,但知识库可以实现这一点。 2.2 开源LLM对一些特定领域的效果非常差,怎么办? 这个问题其实我没有接触过,但上次和群友讨论的时候,有朋友提到了这个质疑,也许真的存在。 这种情况下,我感觉还是得先试试RAG,不行就试试In-context Learning,在上下文中,教LLM一些领域知识。 而我自己的体会是,我自认为的一些特殊的场景,LLM仍然是可以理解的,真的不能小瞧它们的通用知识。 这里还分享一个我个人的体会:128K的上下文长度非常关键! 这个可以降低你RAG的门槛,以及提高LLM对领域知识的掌握。 我真的很难想象,现在还有什么特殊的领域,LLM一点办法都没有,欢迎大家在评论区补充。 2.3 有推荐的方案么? 根据上面的描述,如果你能调用外部的API,那么就根据你的业务要求,选择性价比最高的一款API。 能不自己部署模型,就不自己部署。 自己部署的硬件成本和维护成本,对于小团队来说,很可能是压垮骆驼的一座大山。 而你选择调用API的时候,你就会发现,全世界最聪明的人和最听话的AI,都在抢着为你服务。你完全可以不用管有几台服务器,你可以在任意时间,随便拉高并发量。可以随心随意切换更强的模型,或者更便宜的模型。 具体来说: 将最需要脑子的任务交给o1系列模型,它唯一的缺点就是非常贵。我只说一个概念,它的输入是128K,有效输出长度可以高达2K行,这个可以用来干什么大家自行探索,有些经验我实在不舍得分享出去,哈哈。 比较需要脑子的任务,交给4o,sonnet3.5这一梯队的模型,价格也比较贵,但基本上比多数人的脑子都好。 一些通用任务,可以交给4o-mini和gemini-flash这样的模型,尤其是gemini-1.5-flash-002,性价比高到爆。 这里对任务的划分,就需要一个agent自动编排框架。但是,我目前还没有找到合适的方案,仍然靠着最基础的if-else逻辑,还没能实现全自动化,欢迎大家推荐相关的方案! 如果你的业务在上面的方案中都跑不通,那么自己训练模型大概率也是白瞎。 结语: 看过我之前关于如何吃到行业的低垂果子?帖子的朋友应该知道,我最近一直思考目标选择的问题。 我认为关键因素的突然出现,会给版本带来一些不一样的变化。大家的认知如果能够预知一些变化的下一步影响,那么就可以提前一步,拿到低垂果实。 而大模型时代,基础模型能力的每一次提升,都算是一次版本更新。 距离大厂基座模型团队之外的AI人,需要先了解现有LLM的性能边界,敏锐的分辨出现有模型能力和过去方案的差异,能否给当前的业务带来新的变化,然后快速解决现有业务的难题。 不要在低收益的赛道上无意义的投入,错位竞争,降维打击,也许更有效。
  • 智能体(agent)是大模型应用落地的方式。

    5 9
    5 主题
    9 帖子
    A
    关于AI Agent辅助个人IP打造的案例、实施手法及开源项目的系统梳理,结合行业实践和技术工具,帮助你高效构建个性化数字形象: 一、典型应用案例与手法 创意设计领域 - 智能体工作流驱动专业展示 案例:设计师通过Coze平台搭建多Agent系统,实现“前台分发+专业Agent执行”的协作模式。用户提交品牌设计需求后,前台Agent自动识别任务类型(如IP设计/标志设计),并调用对应专业Agent生成方案,同步输出设计图和文案,强化“全能设计专家”形象1。 手法: 分层任务处理:简单需求由单Agent快速响应,复杂项目触发多Agent协作; 输出标准化:限定Agent必须生成图片+结构化文案,确保内容专业性1。 知识型IP - AI名片+数据分析精准定位 案例:金融分析师使用开源AI智能名片小程序,动态展示个人履历、行业报告及AI生成的实时市场解读。通过内置数据分析发现用户对投资案例关注度高,遂调整内容重心,咨询转化率提升40%8。 手法: 集成知识库RAG:上传个人著作、案例到知识库,Agent自动调用生成定制化内容; 行为驱动优化:分析用户停留时长、点击热点,迭代展示策略8。 社交媒体IP - 自动化运营+人格化交互 案例:博主采用Riona AI Agent管理多平台账号,自动抓取热点生成评论文案,结合Fay框架的数字人分身录制观点视频。账号互动率提升3倍,人设强化为“敏锐行业观察者”25。 手法: 跨平台自动化:定时发布、智能评论、趋势追踪(如Twitter API每日17条推文策略2); 多模态输出:文本+数字人视频组合输出,增强辨识度5。 ️ 二、开源工具与项目推荐 低代码开发平台 Coze Studio(字节跳动开源): 亮点:可视化工作流编排,支持插件扩展(天气/邮件/API等),10分钟快速部署。 场景示例:搭建“个人顾问Agent”,串联日程管理→行业报告生成→邮件推送流程34。 Dify: 亮点:零代码插件集成,支持数据库/搜索引擎直连。 场景示例:电商IP连接订单查询+退货政策库插件,自动处理用户咨询6。 数字人+社交自动化工具 Fay框架: 提供助理版/带货版Agent,支持情绪化语音输出与表情控制。 应用:虚拟主播直播(B站/抖音)、24小时语音助手5。 Riona AI Agent: 专攻社交媒体自动化,支持Cookie保存、代理切换。 功能:自动评论(AI生成深度文案)、跨平台内容同步2。 快速部署方案 JoyAgent-Genie(京东开源): 基于DeepSeek模型,预置个人IP管理模块,支持本地化部署。 特色:数据看板整合访问量、用户行为分析7。 AI智能名片小程序: 开源多商户版支持定制个人主页,集成AI问答、案例展示、预约系统8。 三、核心实施策略 人设工程化设计 角色指令细化:在Agent设定中明确定义口吻(如“幽默科技极客”)、禁忌话题、响应格式1。 工具增强专业感:例如设计师Agent强制绑定DALL·E插件输出高清图,避免文字描述1。 数据闭环驱动迭代 埋点设计:跟踪用户与Agent交互的关键节点(如方案下载率、咨询转化率); 动态调优:基于漏斗数据优化Agent响应逻辑(例:医疗Agent诊断准确率↑45%6)。 轻量技术整合路径 图表 代码 总结建议 初创IP:优先采用AI智能名片小程序8 + Riona社交自动化2,低成本建立专业形象。 深度运营者:组合Coze工作流3 + Fay数字人5,实现内容生产-分发-交互全链路Agent化。 关键注意:Agent需定期注入“人性化”干预(如真人语音样本/个性化回复模板),避免机械感稀释IP温度。 以上工具均提供开源代码,部署文档详见各项目链接。可优先体验Coze Studio可视化平台4或Fay框架直播带货Demo5快速上手。
  • 奇点临近。
    我们何时,以何种方式走向通用智能,我们拭目以待!

    0 0
    0 主题
    0 帖子
    没有新主题