AIDE ML — 机器学习工程代理
精益实施,用于实验和扩展。
pip install aideml
该平台将 AIDE 的功能推广到更广泛的代码优化场景,提供实验跟踪和增强的用户控制。
替换新的搜索启发式方法、评估器
——根据数据集快速构建高性能机器学习管道。
智能体使用数据集,并用通俗易懂的英语描述
。无需 YAML 网格或自定义封装。
aide data_dir=… goal="Predict churn" eval="AUROC"
每个 Python 脚本都成为解决方案树中的一个节点;LLM 生成的补丁会生成子节点;度量反馈用于修剪和指导搜索。OpenAI 的
(75 项 Kaggle 竞赛)发现,AIDE 的
树搜索算法获得的奖牌数量是最佳线性智能体
(OpenHands)的
此仓库提供的实用功能
——查看完整的解决方案树以及附加到每个节点的代码。
Streamlit UI
– 机器学习解决方案原型。
——OpenAI、Anthropic、Gemini 或任何支持 OpenAI API 的本地 LLM。
基于 AIDE 的特色研究
MLE-bench:
在机器学习工程中评估机器学习
RE-Bench:评估语言模型代理相对于人类专家的前沿人工智能研发能力
AI 科学家 v2:基于智能体树搜索的研讨会级自动化科学发现
自动化LLM速通基准测试:重现NanoGPT改进
用于机器学习的人工智能研究代理:MLE-bench 中的搜索、探索和泛化
ML-Master:通过融
合探索与推理,迈向人工智能
知道还有其他引用或衍生自 AIDE 的公共项目吗?
如何使用 AIDE ML
1 Install
pip install -U aideml
2 Set an LLM key
OPENAI_API_KEY=
https://platform.openai.com/api-keys
3 Run an optimisation
aide data_dir=
example_tasks/house_prices
Predict the sales price for each house
RMSE between log‑prices
运行结束后你会发现:
logs/
logs/
– 点击查看解决方案树
pip install -U aideml
adds streamlit
aide/webui
streamlit run app.py
使用侧边栏粘贴您的 API 密钥,上传数据,设置
用户界面显示实时日志、解决方案树和最佳代码。
Choose a different coding model and run 50 steps
aide agent.code.model=
claude-4-sonnet
agent.steps=50 \
data_dir=… goal=… eval=…
agent.code.model
LLM 用于编写代码
gpt-4-turbo
agent.steps
agent.search.num_drafts
在 Python 中使用 AIDE ML
basicConfig
'%(asctime)s - %(name)s - %(levelname)s - %(message)s'
aide_logger
aide_logger.
"Starting experiment..."
Experiment
"example_tasks/bitcoin_price"
# replace this with your own directory
"Build a time series forecasting model for bitcoin close price."
# replace with your own goal description
# replace with your own evaluation metric
best_solution
f"Best solution has validation metric:
best_solution
valid_metric
f"Best solution code:
best_solution
"Experiment finished."
'__main__'
本地LLM(Ollama示例)
OPENAI_BASE_URL=
http://localhost:11434/v1
aide agent.code.model=
data_dir=… goal=… eval=…
注意:评估器默认为 gpt-4o。
完全本地化(代码+评估器——无外部调用)
export OPENAI_BASE_URL="http://localhost:11434/v1"
aide agent.code.model="qwen2.5" agent.feedback.model="qwen2.5" data_dir=… goal=… eval=…
提示:使用完全本地化的模型时,性能可能会有所下降。
docker build -t aide
docker run -it --rm \
${LOGS_DIR
:/app/logs
${WORKSPACE_BASE
workspaces}
:/app/workspaces
/aide/example_tasks:/app/data
-e OPENAI_API_KEY=
your-actual-api-key
aide data_dir=/app/data/house_prices goal=
Predict price
git clone https://github.com/WecoAI/aideml.git
pip install -e
如果您在工作中使用 AIDE,请引用以下论文:
AIDE: AI-Driven Exploration in the Space of Code
Zhengyao Jiang and Dominik Schmidt and Dhruv Srikanth and Dixing Xu and Ian Kaplan and Deniss Jacenko and Yuxiang Wu
2502.13138
archivePrefix
primaryClass
https://arxiv.org/abs/2502.13138
