当前位置:首页 > AI技术 > 正文内容

AIDE ML — 机器学习工程代理

admin2周前 (03-27)AI技术15

精益实施,用于实验和扩展。

pip install aideml

该平台将 AIDE 的功能推广到更广泛的代码优化场景,提供实验跟踪和增强的用户控制。

替换新的搜索启发式方法、评估器

——根据数据集快速构建高性能机器学习管道。

智能体使用数据集,并用通俗易懂的英语描述

。无需 YAML 网格或自定义封装。

aide data_dir=… goal="Predict churn" eval="AUROC"

每个 Python 脚本都成为解决方案树中的一个节点;LLM 生成的补丁会生成子节点;度量反馈用于修剪和指导搜索。OpenAI 的

(75 项 Kaggle 竞赛)发现,AIDE 的

树搜索算法获得的奖牌数量是最佳线性智能体

(OpenHands)的

此仓库提供的实用功能

——查看完整的解决方案树以及附加到每个节点的代码。

Streamlit UI

– 机器学习解决方案原型。

——OpenAI、Anthropic、Gemini 或任何支持 OpenAI API 的本地 LLM。

基于 AIDE 的特色研究

MLE-bench:

在机器学习工程中评估机器学习

RE-Bench:评估语言模型代理相对于人类专家的前沿人工智能研发能力

AI 科学家 v2:基于智能体树搜索的研讨会级自动化科学发现

自动化LLM速通基准测试:重现NanoGPT改进

用于机器学习的人工智能研究代理:MLE-bench 中的搜索、探索和泛化

ML-Master:通过融

合探索与推理,迈向人工智能

知道还有其他引用或衍生自 AIDE 的公共项目吗?

如何使用 AIDE ML

1  Install

pip install -U aideml

2  Set an LLM key

OPENAI_API_KEY=

https://platform.openai.com/api-keys

3  Run an optimisation

aide data_dir=

example_tasks/house_prices

Predict the sales price for each house

RMSE between log‑prices

运行结束后你会发现:

logs//best_solution.py

logs//tree_plot.html

– 点击查看解决方案树

pip install -U aideml

adds streamlit

aide/webui

streamlit run app.py

使用侧边栏粘贴您的 API 密钥,上传数据,设置

用户界面显示实时日志、解决方案树和最佳代码。

Choose a different coding model and run 50 steps

aide agent.code.model=

claude-4-sonnet

agent.steps=50 \

data_dir=… goal=… eval=…

agent.code.model

LLM 用于编写代码

gpt-4-turbo

agent.steps

agent.search.num_drafts

在 Python 中使用 AIDE ML

basicConfig

'%(asctime)s - %(name)s - %(levelname)s - %(message)s'

aide_logger

aide_logger.

"Starting experiment..."

Experiment

"example_tasks/bitcoin_price"

# replace this with your own directory

"Build a time series forecasting model for bitcoin close price."

# replace with your own goal description

# replace with your own evaluation metric

best_solution

f"Best solution has validation metric:

best_solution

valid_metric

f"Best solution code:

best_solution

"Experiment finished."

'__main__'

本地LLM(Ollama示例)

OPENAI_BASE_URL=

http://localhost:11434/v1

aide agent.code.model=

data_dir=… goal=… eval=…

注意:评估器默认为 gpt-4o。

完全本地化(代码+评估器——无外部调用)

export OPENAI_BASE_URL="http://localhost:11434/v1"

aide agent.code.model="qwen2.5" agent.feedback.model="qwen2.5" data_dir=… goal=… eval=…

提示:使用完全本地化的模型时,性能可能会有所下降。

docker build -t aide

docker run -it --rm \

${LOGS_DIR

:/app/logs

${WORKSPACE_BASE

workspaces}

:/app/workspaces

/aide/example_tasks:/app/data

-e OPENAI_API_KEY=

your-actual-api-key

aide data_dir=/app/data/house_prices goal=

Predict price

git clone https://github.com/WecoAI/aideml.git

pip install -e

如果您在工作中使用 AIDE,请引用以下论文:

AIDE: AI-Driven Exploration in the Space of Code

Zhengyao Jiang and Dominik Schmidt and Dhruv Srikanth and Dixing Xu and Ian Kaplan and Deniss Jacenko and Yuxiang Wu

2502.13138

archivePrefix

primaryClass

https://arxiv.org/abs/2502.13138

相关文章

Unity 机器学习 基础

ML-Agents 资产导入 Unity 场景创建 Unity 代码部分 Anaconda 执行 rollerball_config.yaml 机器学习逻辑处理...

跨平台机器学习:ML.NET架构及应用编程

平台上的一个机器学习框架,它提供了一套丰富的算法和工具,使得开发人员可以轻松地构建和部署机器学习模型。支持多种编程语言,包括等,这使得它成为跨平台机器学习的理想选择。的架构主要包括三个部分:数据读取、...

一文讲清神经网络、BP神经网络、深度学习的关系

人工神经网络中的顶级代表。往往说《神经网络》就是指《BP神经网络》。 大家研究着各种神经网络,研究得不亦乐乎, 来了两个家伙Romelhart 和Mcclelland,...

前端开发高级应用:MuleRun如何连接Slack通知 MuleRun消息推送集成配置步骤实战案例|Duuu笔记

若MuleRun无法向Slack推送通知,需依次配置Incoming Webhook或Bot Token、在MuleRun中设置对应通知目标参数,并通过最小化任务测试验证;常见失败原因包括凭据错误、权...

深入理解优化:如何利用 Gemini 3.1 的阶梯计费策略?企业级大规模调用实务完全指南|Duuu笔记

需深入理解Gemini 3.1阶梯计费与调用联动关系,通过识别阶梯区间、请求级Token预估截断、多模型路由调度、响应缓存去重、项目拆分配额绑定五种路径优化成本。 ☞☞☞AI 智能聊天, 问答助手,...

深入理解前端开发:Minimax 视频生成中负面提示词(Negative Prompt)写法完全指南|Duuu笔记

Minimax视频生成中负面提示词需用英文、逗号分隔,支持权重调节(如(blurry:1.3)),按构图/主体/画质/风格四类精简选取,禁用not/no/中文及违规词,须通过A/B测试验证有效性。...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。