当前位置:首页 > AI技术 > 正文内容

AIDE ML — 机器学习工程代理

admin2个月前 (03-27)AI技术51

精益实施,用于实验和扩展。

pip install aideml

该平台将 AIDE 的功能推广到更广泛的代码优化场景,提供实验跟踪和增强的用户控制。

替换新的搜索启发式方法、评估器

——根据数据集快速构建高性能机器学习管道。

智能体使用数据集,并用通俗易懂的英语描述

。无需 YAML 网格或自定义封装。

aide data_dir=… goal="Predict churn" eval="AUROC"

每个 Python 脚本都成为解决方案树中的一个节点;LLM 生成的补丁会生成子节点;度量反馈用于修剪和指导搜索。OpenAI 的

(75 项 Kaggle 竞赛)发现,AIDE 的

树搜索算法获得的奖牌数量是最佳线性智能体

(OpenHands)的

此仓库提供的实用功能

——查看完整的解决方案树以及附加到每个节点的代码。

Streamlit UI

– 机器学习解决方案原型。

——OpenAI、Anthropic、Gemini 或任何支持 OpenAI API 的本地 LLM。

基于 AIDE 的特色研究

MLE-bench:

在机器学习工程中评估机器学习

RE-Bench:评估语言模型代理相对于人类专家的前沿人工智能研发能力

AI 科学家 v2:基于智能体树搜索的研讨会级自动化科学发现

自动化LLM速通基准测试:重现NanoGPT改进

用于机器学习的人工智能研究代理:MLE-bench 中的搜索、探索和泛化

ML-Master:通过融

合探索与推理,迈向人工智能

知道还有其他引用或衍生自 AIDE 的公共项目吗?

如何使用 AIDE ML

1  Install

pip install -U aideml

2  Set an LLM key

OPENAI_API_KEY=

https://platform.openai.com/api-keys

3  Run an optimisation

aide data_dir=

example_tasks/house_prices

Predict the sales price for each house

RMSE between log‑prices

运行结束后你会发现:

logs//best_solution.py

logs//tree_plot.html

– 点击查看解决方案树

pip install -U aideml

adds streamlit

aide/webui

streamlit run app.py

使用侧边栏粘贴您的 API 密钥,上传数据,设置

用户界面显示实时日志、解决方案树和最佳代码。

Choose a different coding model and run 50 steps

aide agent.code.model=

claude-4-sonnet

agent.steps=50 \

data_dir=… goal=… eval=…

agent.code.model

LLM 用于编写代码

gpt-4-turbo

agent.steps

agent.search.num_drafts

在 Python 中使用 AIDE ML

basicConfig

'%(asctime)s - %(name)s - %(levelname)s - %(message)s'

aide_logger

aide_logger.

"Starting experiment..."

Experiment

"example_tasks/bitcoin_price"

# replace this with your own directory

"Build a time series forecasting model for bitcoin close price."

# replace with your own goal description

# replace with your own evaluation metric

best_solution

f"Best solution has validation metric:

best_solution

valid_metric

f"Best solution code:

best_solution

"Experiment finished."

'__main__'

本地LLM(Ollama示例)

OPENAI_BASE_URL=

http://localhost:11434/v1

aide agent.code.model=

data_dir=… goal=… eval=…

注意:评估器默认为 gpt-4o。

完全本地化(代码+评估器——无外部调用)

export OPENAI_BASE_URL="http://localhost:11434/v1"

aide agent.code.model="qwen2.5" agent.feedback.model="qwen2.5" data_dir=… goal=… eval=…

提示:使用完全本地化的模型时,性能可能会有所下降。

docker build -t aide

docker run -it --rm \

${LOGS_DIR

:/app/logs

${WORKSPACE_BASE

workspaces}

:/app/workspaces

/aide/example_tasks:/app/data

-e OPENAI_API_KEY=

your-actual-api-key

aide data_dir=/app/data/house_prices goal=

Predict price

git clone https://github.com/WecoAI/aideml.git

pip install -e

如果您在工作中使用 AIDE,请引用以下论文:

AIDE: AI-Driven Exploration in the Space of Code

Zhengyao Jiang and Dominik Schmidt and Dhruv Srikanth and Dixing Xu and Ian Kaplan and Deniss Jacenko and Yuxiang Wu

2502.13138

archivePrefix

primaryClass

https://arxiv.org/abs/2502.13138

相关文章

LLM介绍

。LLM 被证明在使用指令形式化描述的未见过的任务上表现良好。这意味着 LLM 能够根据任务指令执行任务,而无需事先见过具体示例,展示了其强大的泛化能力。 :小型语言模型通常难以解决涉...

【DL】2023年你应该知道的 10 大深度学习算法

3. 循环神经网络 (RNN) 4. 生成对抗网络 (GAN) 5. 径向基函数网络 (RBFN) 6. 多层感知器 (MLP) 7. 自组织图 (SOM)...

神经网络分类总结

从网络性能角度可分为连续型与离散型网络、确定性与随机性网络。 从网络结构角度可为前向网络与反馈网络。 从学习方式角度可分为有导师学习网络和无导师学习网络。 按连续突触性...

神经网络中的单层神经网络

神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。 看一个经典的神经网络。这是一个包...

推荐10个AI人工智能技术网站

除了研究和开发人工智能技术,OpenAI还积极参与人工智能伦理和安全的研究和探讨。 认为,人工智能技术的发展必须遵循伦理和法律的规范,以确保人工智能的应用不会对人类带来负面影响。...

跨平台机器学习:ML.NET架构及应用编程

平台上的一个机器学习框架,它提供了一套丰富的算法和工具,使得开发人员可以轻松地构建和部署机器学习模型。支持多种编程语言,包括等,这使得它成为跨平台机器学习的理想选择。的架构主要包括三个部分:数据读取、...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。