PyTorch核心开发者灵魂发问:我们怎么越来越像Julia了?
想要Julia的性能,又舍不得Python的生态
PyTorch社区最近有一种声音:下个版本应该抛弃Python改用Julia语言。
现在就连PyTorch团队内部也会拿这个说法来开玩笑。
对这个问题,核心开发成员中的Edward Yang在论坛上作出过一些回应。
他认为PyTorch的确越来越像Julia了,比如借鉴Julia的多重分派特性开发了Pytorch Dispatcher。
PyTorch总体的发展方向也和Julia的愿景一致,也就是同时具备拓展性、易用性和执行性能。
一方面PyTorch的底层代码后期用C++重写以获得更好的性能,另一方面functorch、fx等新功能又让用户可以直接使用Python做以前必须借助C++完成的工作。
那为什么不直接改用Julia呢?
害,其实是舍不得Python那无可替代的生态。
当初从原版Torch使用的Lua改用Python就是看中了生态这一点。这么多年过去了其他语言生态连一点可能超过Python的迹象都没有。
简而言之,Julia语言本身的特性和Python的生态他们全都要,向Julia的优点学习也是团队未来的努力方向。
那么,Julia这种语言到底好在哪,让PyTorch开发团队都向它学习?
面向科学计算设计的语言
Julia来自麻省理工CSAIL实验室,设计初衷就是想要一个既有C的速度又有Ruby的动态性、既能像Matlab一样使用数学表达式又有Python的通用性。
Julia要能像Perl一样自然地处理字符串、像R一样适用于统计,像Shell一样作为胶水语言去和其他语言交互。
要有Hadoop的并行计算能力,又不想要那些繁杂的配置。
最后做出来的Julia采用即时编译(Just In Time),速度比需要解释器的Python快得多,又没有失去交互性。
通过多重分派(Multiple Dispatch)特性来实现类型稳定又不时脚本语言的简洁灵活。
同一个函数名对不同参数类型的调用分派不同的操作,因为适合处理多种数据类型还被PyTorch给学了去。
具体到机器学习来说,Julia执行各类算法包括矩阵运算的速度都比Python快得多。
Julia生态里也有自己的开源深度学习框架Julia Flux。
此外Julia还在语法上对线性代数、数据处理这些场景有额外的优化。
比如支持Unicode数学符号,数字乘以变量时候可以省略「*」,以及索引从1而不是0开始更符合人类直觉….
Julia代码可以写成这样:
α = 0.5
∇f(u) = α*u; ∇f(2)
sin(2π)
以至于有些数学背景的开发者认为,Julia代码写起来就像在黑板上做数学题一样的,很亲切。
相比之下,用Python做矩阵运算感觉就……不是那么好。
Python:
np.dot(array1,array2)
Julia:
array1 .* array2
Julia的历史可以追溯到2009年,由于想实现的功能太多,直到2018年才对外发布1.0正式版。
不过最近几年Julia已迅速被金融、医药、航天等一些行业接受,使用者包括摩根大通、辉瑞、NASA等。
Julia改变了过去他们只能用C等高性能语言做底层开发、同时用高易用性的Python等语言做扩展开发的割裂问题。
今年7月,Julia创始团队成立的公司Julia Computing还获得2400万美元的A轮融资。
Julia语言速度快、天生适合机器学习又在高速成长,也难怪PyTorch社区会有用Julia替代Python的声音出现。
有人认为Python是一种糟糕的语言,虽然有优秀的生态,但生态中对机器学习最有价值的部分(Numpy)其实是用C实现的。
Python生态虽然强大,但人们对其中的混乱也有不少诟病,各种重复开发的包管理系统让配置好Python开发环境都不是一件容易事。
相比之下,Julia的包管理方案就很统一,虽然有可能是还在起步阶段没来得及混乱。
也有人认为Python这些所谓的缺点其实正是它流行的原因。
像Python、Javascript和PHP这种看起来糟糕的语言,正是因为能够轻松的编写糟糕代码,降低了门槛而流行。
这位要提醒大家Julia自身就带有和其他语言的交互功能,他平常会在Julia代码里调用Huggingface的Python模型作开发,两种生态都用上才是坠吼的。
最后,有人很不理解PyTorch开发团队不选择迁移到Julia的做法,既然Julia语言有所有他们需要的特性,还要花时间在Python里重新造轮子是自找麻烦。
另一位的视角有些微妙的不同:
这正是PyTorch团队想把方便留给用户,而把麻烦留给自己。对这种态度我很感激。
参考链接:
[1]https://dev-discuss.pytorch.org/t/where-we-are-headed-and-why-it-looks-a-lot-like-julia-but-not-exactly-like-julia/276
[2]https://news.ycombinator.com/item?id=29354474
[3]https://ucidatascienceinitiative.github.io/IntroToJulia/Html/WhyJulia
- 开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law2024-12-17
- AI音乐战火升级!三路国产大军全面对决Suno2024-12-11
- o1满血版最鲜测!这¥1500花得值吗?2024-12-06
- 谷歌邀马斯克联手做AI游戏!DeepMind版Sora是个3D游戏引擎 profile-avatar2024-12-05