你好,这里是 LazySheep

我是 Hengtao Wu,目前在做一些和语音、生成模型相关的事情,方向主要包括:

  • Text-to-Speech (TTS)
  • Agent / 多模态生成
  • 一点点工程实践 + 一点点好奇心驱动的探索

这个博客在写什么?

这个博客主要分成两种内容:

  • 随笔:一些零碎的想法、记录、以及偶尔的“自言自语”
  • 笔记:相对结构化的学习内容,比如论文理解、技术总结

写它的目的其实很简单:
👉 把“学过的东西留下来”,顺便看看自己能走多远


我的个人主页

如果你想看更完整的信息(比如项目、经历之类的),可以去这里:

Hengtao Wu

那里更像是一个“正式一点”的主页,
而这里更随意一些。


在做的事情

最近主要在折腾:

  • TTS 相关模型(包括一些生成式方法)
  • 尝试把 LLM / Agent 和语音结合起来
  • 做一些小 demo(有的成功了,有的还在挣扎)

联系方式


如果你刚好也在做类似的事情,或者只是路过看到这里,
都欢迎随便看看