当前位置：首页 > AI技术 > 正文内容

开发骡子快跑怎么采集短视频骡子快跑视频采集方法案例|Duuu笔记

admin2个月前 (04-07)AI技术55

前端在复杂场景下的解决方案

骡子快跑的Computer模式最稳，本质是提供7×24小时云端Linux虚拟机，需自行编写或运行爬虫脚本；预装python3.11、curl、ffmpeg，禁用Selenium等GUI依赖；推荐requests+execjs解密+ffmpeg合成，绕过抖音/快手/B站签名校验；定时采集后mv视频至Drive，避免rsync和硬编码Cookie；超级智能体模式不适用长周期采集，易超时且无法续传。

直接用「Computer 模式」跑爬虫脚本最稳

骡子快跑

本身不提供“一键采集短视频”的按钮，它不封装垂直功能，而是给你一台 7×24 小时在线的云端虚拟机——你让它执行什么，它就执行什么。所以采集短视频，本质是让它运行你写的或选中的爬虫逻辑。

常见错误现象：

Permission denied

（没权限调用

curl

或

ffmpeg

）、

ModuleNotFoundError: No module named 'requests'

（依赖没装）、视频链接 403（反爬拦截）。

优先用官方预装环境：骡子快跑的

Computer

模式默认已装好

python3.11

、

pip

、

curl

、

ffmpeg

，不用自己配环境

别写需要 GUI 或浏览器渲染的脚本（比如 Selenium + Chrome）：骡子快跑的虚拟机无图形界面，

chromedriver

会直接报错

no display server

推荐方案：用

requests

execjs

（解密 signature）+

ffmpeg

合并音频视频流，比模拟点击更轻、更快、更稳

怎么绕过抖音/快手/B站的签名校验

几乎所有主流平台的短视频真实地址都带时效性

sign

或

tt_params

，直接扒网页源码里的

src

属性基本是废链。骡子快跑没法帮你“自动逆向”，但它能稳定执行你提供的解密逻辑。

使用场景：你已有 Python 解密函数（比如从某开源项目抄来的

get_sign

），只需把它塞进脚本里，再让骡子快跑定时跑。

把解密逻辑封装成独立函数，例如

gen_video_url(video_id, user_agent)

，避免和请求逻辑耦合

注意时间戳精度：部分平台要求毫秒级

，用

int(time.time() * 1000)

，不是

time.time()

别硬编码 Cookie：骡子快跑每次会话隔离，

无法跨任务复用；改用设备指纹参数（如

device_id

、

iid

）配合 sign 算法更可持续

定时采集 + 自动存到 Drive 的完整链路

骡子快跑的

Drive

是你的专属云盘，所有任务生成的文件默认存在

/home/user/output/

，但不会自动同步过去——得你显式移动。

聚好用AI

可免费AI绘图、AI音乐、AI视频创作，聚集全球顶级AI，一站式创意平台

下载

性能影响：频繁写入大视频文件（>500MB）可能触发 I/O 限频，导致任务卡在

阶段超时。

采集脚本末尾加一句：

mv /tmp/downloaded.mp4 /home/user/output/shorts_$(date +%Y%m%d_%H%M%S).mp4

用

crontab -e

设置定时（如每 2 小时跑一次）：

0 */2 * * * cd /home/user/scripts && python3 tiktok_crawler.py

别用

rsync

同步整个目录：

Drive

不支持硬链接，且会重复上传未变文件；只

新生成的成品文件即可

为什么不用「超级智能体模式」直接问“帮我下100个短视频”

因为那模式是面向一次性交付设计的，底层走的是 SOP + 大模型混合调度，适合“写 PPT”“生成研报”这类目标明确、步骤收敛的任务。短视频采集属于长周期、状态依赖、易中断、需重试的流程型工作，大模型容易在中间环节 hallucinate 出假 URL 或跳过重试逻辑。

容易踩的坑：

超级智能体模式

会主动终止长时间运行的任务（默认超时 6 分钟），而下载一个 3 分钟视频 + 解密 + 合并，很可能超时；一旦中断，进度不保存，重跑就得从头来。

真想省事：先用

超级智能体模式

生成初始爬虫脚本（提示词写清楚平台、字段、反爬要点），再把产出的代码复制到

Computer

模式里手动优化运行

别信“自动识别验证码”：骡子快跑目前不开放图像识别 API 调用权限，遇到滑块或点选，脚本会卡死，必须提前规避

骡子快跑不是黑盒采集工具，它是你远程的一台永不关机的 Linux 电脑——你得告诉它怎么连、怎么算、怎么存。最复杂的从来不是“怎么下”，而是“怎么让下得稳、断了能续、错了能查”。

标签: 案例性能实战开发应用

返回列表

上一篇：海螺如何生成雨雪天气效果海螺天气环境控制最佳践|Duuu笔记

下一篇：长视频生成器官方口突破4秒限制的最新模型盘点|Duuu笔记

开发骡子快跑怎么采集短视频骡子快跑视频采集方法案例|Duuu笔记

相关文章

【大模型应用开发

LLM介绍

神经网络分类总结

几种主要的神经网络

深入理解AI：WorkBuddy 怎么做组织架构图 WorkBuddy 组织架构图生成教程【实战】完全指南|Duuu笔记

AI实战详解：Perplexity 怎么做市场调研 Perplexity 市场分析实操教程【商业】最佳实践|Duuu笔记

发表评论

Copyright Duuu.net Duuu笔记. Some Rights Reserved.

Powered By Z-BlogPHP. Theme by Duuu笔记.

开发骡子快跑怎么采集短视频 骡子快跑视频采集方法案例|Duuu笔记

相关文章

【大模型应用开发

LLM介绍

神经网络分类总结

几种主要的神经网络

深入理解AI：WorkBuddy 怎么做组织架构图 WorkBuddy 组织架构图生成教程【实战】完全指南|Duuu笔记

AI实战详解：Perplexity 怎么做市场调研 Perplexity 市场分析实操教程【商业】最佳实践|Duuu笔记

发表评论取消回复

Copyright Duuu.net Duuu笔记. Some Rights Reserved.

Powered By Z-BlogPHP. Theme by Duuu笔记.

开发骡子快跑怎么采集短视频骡子快跑视频采集方法案例|Duuu笔记

发表评论