Move Mouse to Distort / Click to Toggle
HX
2026
AI Native | 多模态 | 视音频全栈

徐宏喆

HONGZHE XU

Featured Projects / 项目

01

自动化多模态科普内容生产管线

基于音频驱动的程序化动画渲染逻辑 (Manim + VLM),实现零人工干预生成,将周期从月压缩至天。

02

视频语义检索平台

整合 YOLO, CLIP, Qwen-VL 等工具,通过自然语言精准定位长视频情节。

03

图像 AI 监测中台

支持高并发分发的调度中台,具备自动容灾、成本监测及缓存幂等机制。

Statement / 理念

01 / 逻辑主线 擅长将散乱的需求理顺为简洁的系统主线,确保长期稳定和好维护。
02 / 消除幻觉 专注 AI 系统执行的“精准”,通过过滤冗余噪音锁定核心任务。
03 / 跨行整合 将视频业务、AI 工具及硬件连接缝合并跑通,把构思快速转化为代码闭环。

AI & 效率工具

大模型辅助开发 API 编排 RAG 系统

多模态整合

YOLO 视觉大模型 动画引擎 3D 动作重定向

视音频底层

EDL 时码 视频读写压制 流程自动化