
王飞跃,博士,研究员,主要研究方向为平行系统的方法与应用、社会计算、平行智能、知识自动化.E-mail:feiyue.wang@ia.ac.cn.
作者简介:
李 柏,博士,副教授,主要研究方向为自主无人系统运动规划和最优控制.E-mail:libai@zju.edu.cn.
宋秭函,硕士研究生,主要研究方向为基于代理智能的自主无人系统决策规划与控制.E-mail:songzihan@hnu.edu.cn.
李鑫源,硕士研究生,主要研究方向为大语言模型、具身智能、柔性机械臂建模与控制.E-mail:lixinyuan99@hnu.edu.cn.
黄 峻,博士研究生,主要研究方向为平行智能、自动驾驶轨迹预测规划、提示工程、大语言模型等.E-mail:junhuang@ieee.org.
田永林,博士,助理研究员,主要研究方向为平行系统、自动驾驶、场景工程.E-mail:yonglin.tian@ia.ac.cn.
殷烛炎,学士,科研助理,主要研究方向为运筹优化、智能控制、多模态大语言模型.E-mail:1026078242@qq.com.
随着大语言模型技术的高速发展,对话式AI已取得显著进展,但在更复杂任务执行与决策层面仍显局限.为此,代理智能因致力于突破大语言模型仅限信息处理的瓶颈而日益受到关注.文中提出基于代理智能技术的平行厨师智能烹饪系统,提供从菜品决策到烹饪执行的全流程智能化方案.系统综合利用用户健康数据、病史与饮食偏好,实现个性化的菜谱设计与烹饪控制.基于DeepSeek构建多智能体,从烹饪文献提炼专业问答,对大语言模型离线微调,使其具备烹饪推理能力.仿真实验表明,相比推理能力较强的静态大模型GPT o1 pro,代理智能方案融入更丰富的专业知识,更贴合用户需求,凸显出其在健康饮食与个性化服务中的应用潜力.
WANG Fei-Yue, Ph.D., professor. His research interests include methods and applications of parallel systems, social computing, parallel intelligence and knowledge automation.
About Author:
LI Bai, Ph.D., associate professor. His research interests include motion planning and optimal control for autonomous unmanned systems.
SONG Zihan, Master student. Her research interests include decision planning and control for autonomous unmanned systems based on agent intelligence.
LI Xinyuan, Master student. His research interests include large language models, embodied intelligence, and modeling and control of flexible robotic arms.
HUANG Jun, Ph.D. candidate. His research interests include parallel intelligence, trajectory prediction and planning for autonomous driving, prompt engineering, and large language models.
TIAN Yonglin, Ph.D., assistant resear-cher. His research interests include parallel systems, autonomous driving and scenario engineering.
YIN Zhuyan, Bachelor, assistant research. Her research interests include operational optimization, intelligent control and multimodal large language models.
Progress is made by conversation-based AI due to the rapid development of large language models(LLMs). However, limitations still remain in performing more complex tasks and decision-making. Therefore, agentic intelligence is increasingly emphasized to address the bottleneck that LLMs are confined to information processing. In this paper, a parallel chef cooking system based on agentic intelligence is presented to offer an end-to-end intelligent approach from dish planning to cooking execution. User health data, medical history, and dietary preferences are incorporated to enable personalized recipe design and cooking control. In addition, multi-agent structures are built upon the DeepSeek framework, and specialized Q&A pairs are extracted from culinary literature to offline fine-tune the large language model, thereby imparting cooking reasoning capabilities. Simulation experiments show that compared to GPT o1 pro, a static large model with strong reasoning ability, the agentic approach integrates more extensive professional knowledge and better meets user requirements, showcasing its potential in dietary health and personalized cooking services.
近年来, 人工智能技术在多个领域取得突破性进展, 特别是大语言模型(Large Language Model, LLM)这一标志性成果, 凭借其在语言处理上的卓越能力, 推动自然语言理解、文本生成等多个技术领域的迅猛发展[1].LLM的成功应用不仅加速语言相关技术的革新, 还催生更多跨领域的创新, 深刻影响医疗[2]、金融[3]、教育[4]、基础自然科学[5]等各行各业的技术变革和业务模式, 并展现出人工智能在实际应用中的巨大潜力.尽管LLM在语言理解和文本生成方面表现出色, 但是应用范围仍局限于传统的对话系统和信息处理领域, 难以拓展到更复杂的实际任务执行和决策制定[6].随着人工智能技术的不断进步, 研究者们逐渐将关注焦点转向自主性更高的代理智能技术[7].
代理智能(Agentic Intelligence), 又称智能代理、人工智能代理、智能体或大模型智能体, 是具备自主理解、感知、决策、规划与执行能力的系统[8], 可在复杂环境中自主执行并调整任务, 标志着人工智能从单纯信息处理迈向更高层次的自动化与智能化.它能在简要指令下主动拆解任务、规划执行步骤并依据实时反馈进行调整, 解决跨领域多步骤问题并拓展应用, 被视为迈向通用人工智能的重要一步.全球范围内的科技公司正加大对代理智能领域的投资和研发, 市场规模预计将从2024年的51.1亿美元增至2030年的471.1亿美元, 年复合增长率高达44.8%[9], 并将进一步推动社会各层面智能化.目前, 代理智能技术已在教育[10]、军事[11]、管理[12]、制造[13]、交通[14]、财务[15]、艺术[16]等领域表现出强劲的应用潜力.
餐饮业是最有必要迎接代理智能技术变革的行业之一.作为民生的重要组成部分, 餐饮业肩负着满足日益增长的消费者需求的责任.然而, 在快节奏的现代生活和多元化需求下, 传统的饮食服务模式往往难以同时兼顾安全、稳定、健康和个性化的需求[17].在烹饪领域, 代理智能可主动检索并整合互联网菜谱、营养与文化信息, 为消费者量身定制个性化菜谱, 精准融合口味喜好与健康需求.此外, 代理智能还能在烹制过程中自主调整火候、调味配比与操作顺序, 最大程度减少人为失误.一旦出现异常, 代理智能亦可迅速应对并决策, 将非专业人力干预降至最低.借助这一高度自主技术, 餐饮业不仅能为顾客创造专属体验, 也可在效率与品质上实现根本性提升.面对新兴市场挑战与多样化消费趋势, 餐饮行业亟需通过代理智能技术进行深刻变革, 才能更好地满足消费者不断升级的需求.
本文面向餐饮业的智能化升级需求, 提出基于代理智能技术的平行厨师智能烹饪系统, 涵盖菜品选择、菜谱设计与烹饪执行的全过程, 既保障食品安全与出品稳定, 又满足个性化定制需求.首先, 提出“ 物理-信息-社会” 三元融合的平行厨师系统架构.在物理空间, 通过高精度、标准化的执行机构完成自动化烹饪; 在信息空间, 以代理智能为核心, 生成烹饪方案与执行指令; 在社会空间, 通过人机交互方式整合烹饪专家经验与用户反馈, 实现多方协作与数字化传承.三元融合覆盖从设备执行到知识共享的全流程, 使多维信息相互补充, 达成“ 1+1+1 > 3” 的综合效益.然后, 构建基于代理智能的烹饪解决方案.代理智能高效整合用户体征数据、饮食习惯、既往病史及个性化需求, 并结合烹饪领域专业知识和专家经验, 在菜品选择、菜谱设计及烹饪执行各环节实现全过程智能管控.系统可根据实时监测与多模态信息反馈自主调整烹饪流程和参数, 提升菜肴的个性化、安全性与稳定性品级.
随着信息科技的不断进步, 烹饪领域的创新研究大体经历三个阶段, 首先是通过教学改革提升厨师教育水平, 然后致力于实现自动化烹饪系统, 最终发展到围绕科学配餐与饮食推荐算法的探索.为了理清这一路径, 本节从教学改革入手, 回顾烹饪机器人技术的发展脉络, 并在此基础上梳理科学配餐与饮食推荐的研究进展.
为了系统提升烹饪职业教育质量, 教学改革研究从教学互动、校企合作、数字转型、层次衔接、以赛促培等维度开展.薛斌[18]针对传统课堂师生互动不足的问题, 提出互动式教学法, 建立双向反馈机制, 增强学生参与度, 有效促进烹饪核心技能的掌握.王蓓[19]着力破解培养目标模糊困境, 构建现代学徒制培养体系, 依托校企双导师协同育人模式, 实现岗位需求与课程内容的精准对接.滕丽菊[20]顺应数字化转型趋势, 开发智能设备与虚拟仿真厨房联动的数字教育生态, 借助云端平台实现实训过程的可视化监测与跨域资源共享.高志刚等[21]创新“ 行业-企业-学校” 三方联动机制, 通过驻校行会、名店订单等实践载体, 显著提升学生的职业适应能力.杨铭铎[22]系统规划五级人才培养体系, 明确中职强化操作技能、高职侧重菜品研发、本科聚焦教学转化、硕博深入机理研究的分层培养路径.吕慧[23]突破物理实训限制, 设计虚拟现实烹饪仿真系统, 支持无损耗重复训练关键工序.胡凯杰[24]分析“ 以赛促培” 模式在提升烹饪人才社会认可度方面的效果, 强调通过竞赛激励学生增强烹饪技能水平与职业兴趣, 从而提高培养质量和行业认可度.
虽然教学改革显著提升烹饪从业者的专业技能水平, 但是人力依赖型培养模式始终面临操作波动性与职业道德风险的双重挑战.为此, 烹饪机器人技术应运而生, 通过精准复现工艺流程与标准化输出, 在确保菜品品质稳定性方面展现出独特优势.赵兴等[25]针对中餐食材受热不均与工艺动作标准化难题, 设计多自由度搅拌模块与偏心旋转锅具机构, 通过可替换式搅拌头适应不同菜品翻炒需求, 并设计伺服电机驱动的颠勺装置模拟厨师翻锅动作, 实现爆炒虾仁等五道中式菜肴的稳定烹调.彭放[26]针对家用炒菜机结构庞大与火候控制精度不足的难题, 设计滚筒式翻炒机构模拟人工颠锅动作, 通过红外线灶具结合燃气比例调节阀与鼓风机的联动调控实现火候数值化控制, 并通过热学仿真软件对锅具辐射板尺寸及电机散热结构进行优化设计.为了解决传统机械搅拌方式导致的食材破碎问题, 张帆等[27]设计基于拨片旋转的食材翻炒方案, 减少机械搅拌过程中对易碎食材的破坏.马文涛等[28]针对中式烹饪火候控制中存在的经验依赖性问题, 提出基于模糊逻辑的火候调控系统, 监测锅中食材的颜色变化, 并结合红外温度传感器与双压力检测数据, 构建一个专家经验知识库驱动的模糊推理机制, 有效实现小炒肉等对火候要求严格的中式菜肴的标准化烹饪.
上述研究工作致力于提升烹饪机器人的全自动化程度或解决中式烹饪中特有的技术难点, 在维护烹饪品质稳定性的同时, 使机器人烹饪水平逐渐接近人类厨师.然而, 现有方案仍无法根据用户的个人口味偏好进行针对性调整, 也未能借助世界级厨师的专家知识优化烹饪过程.针对这一不足, 余仕毅等[29]设计全自动智能炒菜机, 并为其开发一套支持个性化调整的菜谱设计标准化程序, 但并未给出菜谱个性化调整的技术细节, 也未能将世界顶级厨师的专业经验融入烹饪过程中.
为了进一步提升菜肴的烹调质量, 传统的人工培训方法或机器人烹饪技术虽主要聚焦于对烹饪过程本身的优化, 但科学合理的膳食搭配推荐方案则从菜肴选择与烹饪方案设计入手, 从源头影响最终的菜肴品质.针对传统菜肴推荐系统忽视食材搭配合理性及推荐结果同质化的问题, 林泽聪等[30]在协同过滤推荐算法框架中融入中医食补的相生相克规律, 采用轮盘赌策略增强推荐结果的多样性.樊祥超等[31]针对传统菜肴推荐系统忽视动态用餐情境的不足, 提出基于时间序列的上下文感知模型, 分析用户历史用餐时段、食物食用量及主料-味道-做法三维特征相似度, 构建动态偏好向量, 优先推荐与用户近期高摄入食物在特征空间相似度较高的候选菜品.曾子文等[32]关注营养协同效应及用户动态热量摄入需求, 提出卡路里感知异构图网络, 在自监督学习过程中同步挖掘食材共现模式与卡路里层级关联, 建立以代谢需求为导向的推荐机制.刘庆[33]在传统饮食推荐系统中引入疾病相关的健康约束, 从个人电子病历中抽取慢性病实体, 并结合营养病志数据, 生成符合用户健康需求的每日食物摄入建议.此外, 该系统还采用基于时序建模的饮食偏好预测方法, 使推荐结果能因用户健康状况与饮食偏好变化动态调整, 兼顾推荐的针对性与灵活性.
然而, 现有饮食推荐方法虽在一定程度上根据用户个人因素进行定制化推荐, 但由于方法大多依赖静态知识库或更新缓慢的用户历史数据库, 难以迅速响应用户提出的全新个性化需求.同时, 构建和维护知识库或数据库的效率较低, 也在一定程度上限制其灵活性与时效性.
尽管现有的烹饪教育改革、烹饪机器人技术及饮食推荐系统在提升烹饪质量和个性化推荐方面做出重要贡献, 但仍存在若干不足.首先, 烹饪教育改革虽然优化教学方法, 但仍难以有效解决操作波动和职业道德风险等问题.其次, 尽管烹饪机器人技术在提升烹饪稳定性和精准性方面取得一定进展, 但仍缺乏对用户个性化口味和世界级厨师经验的灵活调节能力.最后, 现有饮食推荐系统虽然能够考虑用户的个人健康需求和饮食偏好, 然而在快速响应用户最新提出的个性化需求方面仍显不足, 并且对烹饪专业知识和人类顶尖厨师经验的继承能力也有待提升.
本文构建一套基于代理智能技术的平行厨师智能烹饪系统, 通过物理空间、信息空间与社会空间的三元融合协作, 实现烹饪过程的智能化重构与知识传承范式创新.平行厨师智能烹饪系统总体架构如图1所示.
该系统突破传统自动化烹饪系统的功能局限, 建立动态知识融合机制与双向认知增强策略, 形成具备高度自主决策与持续进化能力的智能烹饪中枢.
平行厨师智能烹饪系统在物理空间中对应烹饪系统的硬件, 由烹饪执行单元、多模态传感单元和运算处理单元三部分组成.烹饪执行单元包括多自由度柔性机械臂与模块化烹饪机构, 可完成煎、炒、烹、炸、煸、焖、炖等典型中式烹饪动作.多模态传感单元集成立体视觉、触觉反馈与红外成像等传感器, 用于实时监测食材形状、质地、颜色变化及锅内温度等关键参数.运算处理单元由边缘计算节点和云端服务器协同工作, 前者负责快速融合分析感知数据, 后者运行代理智能算法并生成具体操作指令, 实现对整个烹饪过程的高效管控.
平行厨师智能烹饪系统在信息空间中部署多个智能体.任务规划智能体负责解析烹饪任务目标, 生成逻辑严密的执行流程.信息聚合智能体整合用户体征数据、饮食偏好等个性化信息, 构建跨领域知识融合通道— — 不仅集成营养学标准、临床医学禁忌和食品美学评价体系等静态知识库, 也实时获取互联网餐饮信息, 甚至支持导入资深厨师的烹饪经验数据.在此基础上, 菜谱设计智能体调用经烹饪专业知识微调的LLM, 并通过知识推理引擎综合分析食材配伍、营养平衡和风味偏好等约束条件, 生成符合用户需求的定制化方案并进行必要的合理性检验.烹饪过程控制智能体依托数字孪生引擎构建虚拟烹饪环境, 模拟机械臂运动轨迹与热力学场域的演变, 并根据物理传感器的实时反馈动态调整操作指令及数字孪生模拟器配置.交互认知智能体通过自然语言接口实现烹饪过程解释与调整建议的人机交互.
平行厨师智能烹饪系统在社会空间中主要面向三类人群:普通用户、资深厨师与烹饪初学者, 旨在通过多向互动强化人机之间的信任与协作, 也使烹饪知识的积累与传承得以高效延伸到不同地域与学习层次.对普通用户而言, 烹饪系统开放自身内部处理流程, 通过可视化交互界面让普通用户了解餐食设计的原理与营养调配思路, 也能实时采集用户口味反馈并加以个性化调整.对远程专家级厨师而言, 烹饪系统支持专家将口头指导或技能诀窍转化为标准格式信息, 以便在信息空间中辅助菜谱设计、烹饪过程控制等环节.在烹饪制作全部完成之后, 如用户满意, 烹饪系统可总结烹饪过程和经验, 为烹饪初学者提供个性化烹饪教学案例.
鉴于物理空间与社会空间的部署方案都是模块化的, 并且技术方案相对稳定[34], 本节主要讨论信息空间中的功能模块, 特别是各智能体的工作机理.信息空间中以“ 需求解析-知识融合-方案推敲-执行优化-交互反馈” 为线索的递进工作流程图如图2所示.
![]() | 图2 平行厨师智能烹饪系统信息空间工作流程图Fig.2 Schematic diagram of information-space workflow in parallel chef intelligent cooking system |
任务规划智能体通过多模态交互接口接收用户饮食需求, 并构建多层级任务解析框架.该智能体采用“ 需求理解-特征分析-知识匹配” 的认知架构, 通过3个LLM单元协同工作, 实现从用户需求到细化烹饪任务的转化, 具体工作流程如图3所示.
任务分解LLM作为任务规划智能体中的一个基础单元, 用于接收和理解用户以文字形式提出的烹饪需求, 并输出一系列可执行的子任务序列.当用户明确提出菜品需求时, 任务分解LLM只需结合用户身体健康状况核实该菜品是否适宜, 并生成相对简单的子任务列表.面对模糊需求(如炒制低脂高蛋白的经典川菜)时, 启动语义扩展与推理机制, 形成更复杂的子任务列表, 如提取经典川菜清单、分析油脂与蛋白质含量限制、分析烹饪手法约束等.任务分解LLM通过将用户显式/隐式诉求分解为层次化的可执行子任务序列, 为任务规划智能体中的其它单元提供明确的工作依据, 其输出的子任务序列将在后续菜肴生成智能体中予以实施.
个人信息收集清单LLM是任务规划智能体的第二个单元, 输入来自前述子任务序列, 输出为用户个性化信息清单, 通过分层推理机制构建用户画像.首先在基础层识别饮食禁忌与生理限制(如过敏原、血糖指标), 然后在优化层提取风味偏好与文化属性, 最终在扩展层关联美学标准与场景需求(如摆盘方案及场地风格).该单元生成的采集清单并非一成不变, 而是依据子任务序列的具体需求动态增删, 从而确保仅包含必要信息.
跨领域专业知识清单LLM以子任务序列为输入, 并输出跨域专业知识清单.该单元负责识别用户饮食需求背后的学科交叉特征, 构建专业知识的锚定体系.该单元不负责匹配烹饪领域的常规知识, 而是识别营养学配餐原则、临床医学禁忌规范、食品工程标准及饮食美学评价体系等与烹饪相关却非烹饪专业范畴的知识.
信息聚合智能体负责收集用户的个性化信息及相关专业知识, 为后续的菜谱设计工作提供结构化输入.该智能体包括三个单元:人机交互LLM、个人信息收集智能体及专业知识检索增强生成系统, 形成多维度的信息整合框架.具体工作流程如图4所示.
人机交互LLM单元以子任务序列为输入, 最终输出更新后的子任务序列及专家介入知识.首先, 根据现有子任务序列解读用户的原始烹饪需求, 并将理解结果通过交互认知智能体反馈给用户.如果在此过程中出现信息缺失或不明确之处, 通过多轮对话的方式引导用户进行进一步补充, 从而更新子任务序列.当遇到复杂或疑难烹饪场景时, 可请求资深厨师远程接入, 即由专家通过语音、文字或视频等多模态形式提供建议与指导.随后, 多模态LLM将专家建议信息转换为结构化文字数据, 即专家介入知识, 为后续菜肴决策与执行过程提供更丰富的经验支撑.
个人信息收集智能体输入用户个性化信息清单, 输出结构化的用户个性化信息.该智能体通过书写程序脚本以采集传感器数据或调取医疗记录等, 逐项提取个性化信息清单中的内容, 并利用提示工程将其转化为结构化的文本数据, 统称用户个性化信息.
专业知识检索增强生成模块负责读取跨域专业知识清单, 输出跨域专业知识.除了从静态数据库上提取权威文献和经典著作等长期存储内容以外, 还调用短时记忆模块, 获取在系统运行过程中产生的临时知识或实时环境信息, 从而实现跨领域的信息收集与整合.通过检索增强生成技术, 静态数据库与短时记忆模块中涵盖的营养学、医学、热力学等专业知识将整合为结构化数据, 为后续的烹饪决策提供有力支持.静态数据库强调知识的深度与可靠性, 短时记忆模块关注知识的时效性与灵活更新, 两者共同确保跨域专业知识在实际应用中具备充分的权威性与准确性.
菜谱设计智能体的核心目标在于综合用户需求、个人体征数据及相关专业知识, 生成符合个性化需求的定制化菜谱.为了达成这一目标, 该智能体下设三个单元:菜肴决策智能体、菜谱搜索智能体与菜谱定制化设计智能体.具体工作流程如图5所示.
作为菜谱设计智能体之中的第一个单元, 菜肴决策智能体以更新后的子任务序列与用户个性化信息为输入, 并输出确定的目标菜肴.当用户需求相对明确时, 仅需对照子任务序列与个人健康数据进行验证, 而在用户意图模糊或仅提出若干约束(如低脂、川味、补铁等)时, 菜肴决策智能体会依次执行子任务序列, 并通过编写并运行相应代码或逻辑操作, 逐步收敛至最适宜的菜肴名称.由此, 在不违背用户身体健康要求的前提下, 能对“ 吃什么” 做出精准决策, 为后续的菜谱搜索与菜谱定制化设计奠定基础.
一旦完成菜肴选择, 菜谱设计智能体中的菜谱搜索智能体单元便开始工作.其输入为菜肴名称, 输出为符合行业或团体标准的标准菜谱.为了实现这一目标, 该智能体通过编写脚本在公开互联网上检索烹饪相关的行业规范或广泛认可的菜谱, 并对多种信息源进行反复筛选与排序, 获取置信度与认可度最高的烹饪方案.考虑到可能出现新菜品, 菜谱搜索并不依赖离线菜谱库, 而是选择由行业组织或营养协会认证的最新菜谱, 从而确保其权威性、准确性与时效性.
菜谱定制化设计智能体是菜谱设计智能体中的第三个单元, 负责将原始菜谱与跨域专业知识、用户个性化信息及专家介入知识结合, 生成符合用户需求的定制化烹饪方案.首先, 基于一个已离线微调的专业烹饪LLM, 对原始菜谱进行评估与调整, 确保在保留菜肴核心风味的同时, 优化营养结构与口味搭配, 并充分考虑用户的健康状况、饮食习惯及远程专家建议.这里所说的微调LLM是对通用基础LLM在烹饪知识与常识领域进行强化训练后得到的, 具备专业厨师水准的推理与评估能力.随后, 菜谱定制化设计智能体单元对生成的定制化菜谱执行后验验证步骤, 再次审查其健康性与安全性, 如有不妥则在输出定制化菜谱之前继续调整.此外, 定制化菜谱会通过交互认知智能体传递至社会空间, 使用户得以了解调整思路与依据, 增强社会空间对这套智能烹饪系统的信任与理解.
在完成定制化菜谱以后, 烹饪过程控制智能体将设计方案转化为可执行的动作指令, 驱动物理空间中的相关机构形成闭环控制.在离线阶段, 该智能体首先针对整道菜的烹制流程进行细化规划, 包括加热温度曲线、搅拌速度与投料顺序等, 并借助数字孪生引擎对机械臂运动与热力学环境进行模拟推演, 以此优化指令并降低实际操作中的失误.在正式进入烹饪阶段以后, 多模态传感器持续采集温度、视觉与压力等数据并实时回传.控制智能体将这些反馈与数字孪生模型进行对照, 若发现偏差立即动态修正操作指令及模型参数, 确保烹饪过程在多变场景下保持高品质输出.
交互认知智能体负责在人机交互层面上为社会空间的多方角色(普通用户、资深烹饪专家及厨师学徒)提供可解释的操作流程与信息反馈, 提升用户对平行厨师系统的理解与信任.通过智能体协作, 交互认知智能体能在整个烹饪流程中发挥如下关键作用.一方面, 为用户实时呈现烹饪操作与决策依据, 减少信息不对称性; 另一方面, 为资深厨师和学徒提供可追溯的操作细节流程和经验传承通道, 确保专业经验在数字化平台上得到充分发挥与延伸.
交互认知智能体下设四个子模块:决策执行释因LLM、用户诉求解析LLM、厨师教学案例生成LLM及资深厨师意见生成LLM.决策执行释因LLM将烹饪过程控制智能体及其它信息空间模块的微观执行步骤转化为人类容易理解的文字、图像或短视频说明, 并对关键决策点进行简要的“ 释因” 阐释, 帮助用户和厨师学徒了解系统每步操作的逻辑原理.用户诉求解析LLM基于多轮对话交互的方式, 对用户提出的新需求、疑问或反馈进行细化与澄清, 并转换为精确的文本信息回传至信息空间, 以便各功能模块进行相应更新或调整.同时, 厨师教学案例生成LLM根据烹饪过程中的实时数据与操作记录, 自动生成结构化的教学案例, 包括工艺步骤、关键参数和注意事项等, 为厨师学徒提供逐步学习与演练的素材.在遇到复杂或疑难烹饪场景时, 系统可通过资深厨师意见生成LLM请求专业厨师的远程指导, 并将其语音、文字或图像信息转换为结构化文本, 帮助信息空间中的各模块融合专家经验进行决策优化.最终, 经过交互认知智能体的多层次处理, 所有交互数据都会被传递至社会空间, 确保用户、厨师学徒和资深厨师均能在统一的交互平台上对烹饪流程予以掌握、反馈与改进, 从而在效率与透明度之间取得良好平衡, 进一步推动厨艺的持续创新和传承.
本节针对平行厨师智能烹饪系统的应用效果展开初步实验.由于本研究的核心工作集中在信息空间, 而物理空间的烹饪执行结构与社会空间中的资深厨师等尚未部署, 实验评估将主要聚焦于信息空间的各智能体.
为了满足并行计算与深度学习推理的高负载需求, 系统选用一台配备8张NVIDIA Tesla V100-SXM2显卡(显存32 GB、GPU主频1290 MHz)的服务器作为核心计算节点, 并在Ubuntu 20.04操作系统下运行Python 3.10.16及相关第三方计算库(如PyTorch、TensorFlow和各类科学计算库).显卡集群可同时加速多智能体的推理与训练, 确保在面对复杂烹饪任务时依然高效完成实时分析与决策.
实验设计涵盖两个应用场景, 用于评估平行厨师智能烹饪系统在多样化需求下的适应性与实用价值.第一个场景聚焦于鲁菜“ 葱烧海参” , 用户仅提出“ 想吃鲁菜中的葱烧海参” 这一简单意图, 系统需在结合用户体征、饮食偏好及相关专业知识的基础上, 经过多轮推理与评估后输出兼顾鲁菜风味与健康需求的个性化菜谱.第二个场景面对一位长期旅居海外、思乡心切的用户, 他在中秋节前夕希望品尝杭帮菜, 于是向系统发出“ 今天吃杭帮菜, 在国外旅居多年没回杭州了, 中秋节想家了” 这类蕴含情感与文化背景的请求.在此情境中, 系统需在保证菜品正宗与营养均衡的同时, 适度融合杭帮菜的风味特色与文化记忆, 为用户带来心理与味觉上的双重满足.
本研究采用的LLM基于DeepSeek公司开源模型[35].DeepSeek是一家于2023年在杭州创立的中国人工智能企业, 技术实力处于全球领先水平, 代表性产品包括DeepSeek-R1与DeepSeek Chat等.综合考虑计算硬件条件以后, 最终选择DeepSeek-R1[36]作为核心大语言模型进行实验验证.
将两个用户场景的需求输入信息空间中的任务规划智能体, 分别交由任务分解LLM、个人信息收集清单LLM和跨领域专业知识清单LLM这三个子单元处理.由于此环节仅需常识层面的推理与信息整合, 不涉及深入的烹饪专业知识, 这些子单元均采用未经微调的开源基础模型DeepSeek-R1-Distill-Qwen-32B, 以便在无需额外训练的条件下依然能完成任务分解、用户信息收集和跨领域知识匹配等任务.
任务规划智能体通过结构化提示词将用户需求传递给三个LLM单元, 并要求其按照约定格式输出结果, 最终获得如表1所示的子任务清单与信息收集要点.使用DeepSeek-R1-Distill-Qwen-32B的原因, 是因为在本环节仅需模型的推理能力, 不必针对烹饪领域进行微调.事实上, 由于本文采用的计算硬件条件难以对32B版本开展微调工作, 因此后续如需要对LLM进行微调时不得不使用更小体量(8B)的DeepSeek-R1.
![]() | 表1 任务规划智能输出结果 Table 1 Output of task planning agent |
本节评估信息聚合智能体对用户信息与烹饪专业知识的综合处理能力, 并在表2中列出采集结果.
![]() | 表2 信息聚合智能体输出结果 Table 2 Output of information aggregation agent |
在用户信息收集方面, 信息聚合智能体依据任务规划智能体输出的需求条目, 分别通过人机交互界面获取如体征数据、过敏禁忌和口味偏好等显式信息.同时调用脚本与应用程序编辑接口(Appli-cation Programming Interface, API), 结合电子健康档案、环境监测接口及用户设备日志, 挖掘可能的隐式需求并形成完整用户画像.
此外, 信息聚合智能体还承担烹饪专业知识的收集与构建任务, 用于满足后续菜谱设计对专业性的要求.具体做法包括:在中国知网上检索702篇烹饪相关论文, 并借助GPT o1网页端对美学、医学、药膳、调味、代谢及个性化饮食等要点进行自动问答提取, 具体提示模版示例如下.
阅读文献文本, 从烹饪常识、技巧、调味、营养等烹饪相关方面提炼多组问答, 格式为
Q:XXXXXXXXXXX
A:XXXXXXXXXXX
每组独立, 排除无关内容, 仅采集信任的烹饪信息, 严禁编造虚构, 务必忠实于原文.
文献文本如下:XXXXXXXXXXX
随后, 这些问答数据被转化为单轮对话格式, 具体对话格式示例如下.
[
{"instruction":"在烹制芹菜瘦肉汤时, 怎样保持芹菜的
清香和脆感, 同时让汤味更加鲜美?",
"input":"",
"output":"可先将瘦肉切丝后用生姜略炒, 再加入鲜汤
和芹菜一起煮沸。芹菜入汤时间不宜过长, 待汤沸后稍
煮即可, 以免芹菜过软影响口感。"},
{"instruction":"芹菜瘦肉汤中的杏仁为什么适合和瘦
肉、芹菜同用?",
"input":"",
"output":"杏仁有润肠和缓解咳嗽的作用, 与肉类和芹
菜搭配, 有助增添清香并提升食疗效果。炒香杏仁或直
接煮入汤中都可以, 使汤滋味更丰富。"},
{"instruction":"制作蛋卷银杏汤时, 如何让蛋皮更薄并
裹住馅料而不易破?",
"input":"",
"output":"将鸭蛋打散, 用平底锅小火摊制薄蛋皮, 待
蛋皮表面稍凝固即可出锅。摊好后先放凉, 再把肉馅卷
入, 且蛋皮厚度要均匀, 蒸或煮时不易破损。"},
]
最终形成4 101条问答条目构成静态知识库.选用DeepSeek-R1-Distill-Llama-8B模型, 通过低秩适配(Low-Rank Adaptation, LoRA)进行离线微调, 得到一套具备专业烹饪知识推理能力的大语言模型.
菜谱设计智能体由菜肴决策、菜谱搜索和菜谱定制化设计三个子单元组成.4.3节微调后大模型为菜肴决策、菜谱搜索及菜谱定制化设计三个子单元提供专业知识的支撑.
菜谱设计智能体由菜肴决策智能体根据信息聚合智能体的输出信息确定目标菜品.搜索智能体利用该决策结果检索互联网上的行业标准菜谱; 菜谱定制化设计智能体基于标准菜谱与用户个性化信息生成初版定制化烹饪方案.最后, 对该初版方案进行审核并输出终版定制化菜谱, 为了效果对比, 将两个场景的用户需求分别输入菜谱设计智能体和GPT o1 pro, 最终烹饪方案如表3和表4所示.
![]() | 表3 GPT o1 pro输出结果 Table 3 Output of GPT o1 pro |
![]() | 表4 菜谱设计智能体输出结果 Table 4 Output of recipe design agent |
交互认知智能体同样基于微调版DeepSeek-R1-Distill-Llama-8B.该智能体结合信息聚合智能体输出的信息, 对标准菜谱与审核后的终版定制化菜谱进行对比, 并输出相应的个性化设计原因与理由.
最终, 通过社会空间接口将这些差异及其合理性以易于理解的方式告知用户, 相关结果如表5所示.
![]() | 表5 菜谱定制化智能体输出结果 Table 5 Output of interactive cognitive agent |
本节逐一分析平行厨师智能烹饪系统信息空间中各智能体的性能.
表1显示, 场景1的用户目标明确, 任务分解LLM能精准识别“ 葱烧海参” 所需的核心食材与调料, 并针对用户提供的慢性病史、糖盐控制需求等信息逐层细化子任务, 从而在营养安全与口味保留之间取得平衡.在场景2中, 用户仅模糊提出“ 想吃杭帮菜、思乡” 的需求, 任务分解LLM通过多层检索用户习惯和当地食材供给, 融入对海外替代食材、文化情感与节日氛围的考量, 最终输出完整的采购、烹饪及口味调整流程, 体现出对更复杂且情感化需求的适配能力.个人信息收集清单LLM同样在两种场景中展现出高度灵活性.在场景1中, 重点关注用户血糖、海鲜过敏等健康风险, 并综合考量口感需求, 如酱汁浓淡与盐分使用.在场景2中, 更侧重高血压管理、体重控制及思乡情绪等, 多渠道收集与整理信息, 有效兼顾情感因素与健康维度.跨领域专业知识清单LLM在场景1中为鲁菜提供历史与审美背景, 帮助用户更好地理解地域特色.在场景2中加入饮食心理学与情感认同研究, 为思乡菜品赋予更多文化与情感内涵.从客观分析来看, 任务分解LLM在明晰或模糊需求下均能给出兼顾健康与风味的执行路径, 个人信息收集清单LLM的条目覆盖充分且具有针对性, 跨领域专业知识清单LLM兼顾健康、文化与心理, 多维度满足用户多样化诉求.这种多环节协同规划使不同类型的需求都能被逐步拆解并加以回应, 在确保烹饪专业性与安全性的同时, 也充分融入对个人情感和文化背景的考量, 说明本文的平行厨师智能烹饪系统在不同场景下都可保持良好的适应性与专业性.
表2显示, 对于场景1中54岁、患有2型糖尿病且需控制血糖的用户, 系统能及时从API检索空气质量、室温和用户当日进食信息等显式数据, 并结合用户慢性病史与饮食习惯, 准确输出低糖、少油的饮食建议.更关键的是, 信息聚合智能体还能通过用户病史与口味偏好推断其“ 倾向于健脾养胃并辅助稳定血糖” 等隐式需求, 进一步强化对个体化需求的把握.相比之下, 场景2中用户虽然仅报告部分基础信息, 如年龄、体重、所处地区与偏好杭帮菜等, 但信息聚合智能体通过综合分析其最近三个月的饮食记录和高血压病史, 得出该用户已逐步减少高热量食品摄入并更加关注体重管理的隐式结论.同时, 对当下工作压力和思乡情绪的关注, 也反映出智能体能将环境与心理因素纳入信息提取流程, 从而为后续菜品决策提供更全面的参考.整体而言, 信息聚合智能体在明确或模糊输入条件下, 都能充分挖掘用户的显式信息与隐式信息, 包括体征数据、食物过敏史、环境参数及个人情感等多层次因素.这一多重维度的整合不仅避免健康与口味方面的潜在冲突, 而且能结合用户情绪和文化需求, 为后续菜肴方案提供更具针对性与灵活度的决策支持.
4.4节主要考察菜谱设计智能体在满足用户个性化需求与健康限制方面的能力, 并与未使用代理智能的静态大模型(GPT o1 pro)进行对比.根据表4内容, 菜谱设计智能体在场景1遇到糖尿病用户时, 能主动降低葱烧海参中糖分含量并添加适合糖尿病患者的低脂蔬菜, 最大限度避免血糖波动的风险.在场景2中, 针对思乡且患有高血压的用户, 智能体推荐西湖醋鱼, 同时强调选择脂肪含量较低的鱼肉和使用有限盐分.此类调整不仅符合使用者的实际健康状况, 也在菜式风味与安全性之间取得平衡.相比之下, 表3中GPT o1 pro对场景1的输出仅给出通用的葱烧海参做法, 无视糖尿病用户所需的控糖措施, 而在场景2中, 该模型甚至推荐不适宜高血压人群的东坡肉, 忽略用户需控制脂肪及盐分摄入的关键需求.对照表3和表4可见, GPT o1 pro能生成口感和操作性都较完整的菜肴说明, 但缺乏针对性与健康管理意识, 暴露出其在面对特定病理与饮食禁忌时的不足.相反地, 菜谱设计智能体通过菜肴决策、标准菜谱搜索、定制化设计与审核等环节, 将用户体征、口味偏好与文化背景纳入整体决策流程, 使最终菜谱在营养、安全与风味方面达到更全面的优化.从结果分析上看:智能体在场景1中对糖分、盐分和烹饪方式的细节调整有助于稳定血糖; 在场景2中通过低脂肉类和微盐使用等策略缓解高血压压力, 同时顾及用户的思乡情结.综上所述, 菜谱设计智能体基于离线微调的大语言模型, 较好地实现个性化烹饪方案的精准匹配, 而静态大语言模型在专业知识与健康管理上难以为用户提供足够安全、可靠和情感关怀的定制化饮食方案.
基于微调之后的大语言模型交互认知智能体, 对菜谱定制化设计智能体输出的个性化方案进行解析与说明, 并将释因以自然语言的形式展示给用户.从表5结果来看, 智能体能针对不同健康需求、口味偏好和情感诉求提供清晰合理的解释.在场景1中, 交互认知智能体不仅说明如何通过降低糖分和盐分满足糖尿病用户的血糖控制需求, 还详细阐述为何选用橄榄油或菜籽油替代花生油, 从而减少高脂肪摄入.同时, 其解析过程强调在烹饪中增加蔬菜比例, 以及使用红枣或梨片替代部分糖分, 兼顾菜肴风味和健康管理.这既对“ 为何这样做” 给出充分理由, 也帮助用户理解整道葱烧海参的改良思路.在场景2中, 交互认知智能体同样能对西湖醋鱼的低盐、低脂做法予以解释, 例如:如何选择小鲤鱼或草鱼的瘦肉部分, 减少食盐和糖的使用, 辅以清淡蔬菜以避免高油耗的烹饪方式.此举既有利于用户高血压的控制, 也能缓解思乡人群对家乡风味的情感需求.值得注意的是, 智能体在输出这些原因时, 会主动结合用户的个性化信息, 如血压病史、思乡情绪、烹饪环境, 清楚展示各项调整之间的关联与影响.这种多维度的释因机制使整个菜谱定制过程不仅具有更高的可解释性, 还能为后续教学或健康管理提供可追溯的案例素材.相比传统的“ 黑箱式” 烹饪推荐, 交互认知智能体的透明化输出不仅让用户对自身饮食方案的合理性具有清晰的认识, 也进一步巩固系统在多场景下的适用性和可信度.总之, 该结果说明交互认知智能体在理清定制化菜谱所做的调整及动机方面成效显著, 其生成的解释性文本能兼顾专业性与可读性, 为用户提供富有针对性且容易理解的菜谱定制依据.
本文构建基于代理智能的平行厨师智能烹饪系统, 并在信息空间中设计多智能体协同机制, 实现个性化需求解析、菜谱定制及可解释的烹饪管控.实验表明, 该系统在适配不同健康状况、饮食偏好与烹饪场景时, 具备良好的灵活性与安全性, 可在信息聚合、菜谱生成与人机交互等环节提供高效、精准的决策支持.今后除了进一步深化社会空间的运用, 如开展多层次烹饪竞赛与培训活动、吸纳专业厨师和消费者共同参与, 强化物理-信息-社会三元融合的联动效应以外, 还需围绕烹饪结果的客观评价与主观评价持续拓展研究.具体而言, 一方面可借助传感器与营养分析手段, 对菜肴品质与营养成分进行量化评估, 另一方面, 通过收集用户舌尖偏好、情感反馈与社群互动信息, 形成多维度的主观评价体系, 进一步完善平行厨师社区生态, 推动智能烹饪的实用化与规模化应用.
致谢 自2014年以来, 在青岛智能产业技术研究院(QAII)及其智慧医疗研究所等二级单位的支持下, 启动“ 饮食5.0(Cuisine 5.0)” 、“ 伊尹大模型” 等项目, 并在青岛、北京、威海等地开展实验, 致力于通过AI和智能科技推动“ 医衣食住行” 民生产业的变革, 最终造福人类.2021年, 研究院正式启动“ 平行厨师” 项目.2022年以来, 研究院进一步设立“ 伊训MeTaurant(元餐厅)” 研究专题, 由李柏、田永林和王飞跃教授负责, 专注于元宇宙、大语言模型、AI智能体、检索增强生成等新型AI(包括Agentic Intelli-gence与Autonomous Intelligence)技术在民生领域的创新应用, 本文便是以上项目前期研究的部分成果.我们谨向过去十年里参与讨论、研究和实验的所有科研与工程人员表达诚挚的感谢.
本文责任编委 张军平
Recommended by Associate Editor ZHANG Junping
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|