Skip to content
~/nihildigit
Go back

狂想:基于LLM的NL2Code编译器

NL2Code(自然语言转代码)是指从自然语言描述生成代码的任务,
它在代码智能领域被视为一个重要而紧迫的挑战。
近年来,随着预训练技术的快速发展,大型语言模型在代码生成方面的应用逐渐增多,推动了NL2Code领域的发展。

胡思乱想

学Python的时候意识到,很多Python的高级特性其实可以理解成C语言这种中级语言的语法糖。
C到汇编同理,所谓”高级语言”在执行的本质还是对内存的操作。
是否可以按照伪代码为基准,设计一门比如今的编程语言抽象程度更高的语言呢?
我们需要设计一个编译器,它能把伪代码翻译成执行效率高的C等代码,接着对中间代码进行二次编译。
这样会牺牲编译效率,但是可以极大缩短编程时间。
(简单来说,鉴于LLM目前显示的编程能力,我们可以设计一套伪代码,方便人类与LLM的更快沟通,这种伪代码可以作为一种高级抽象语言存在)

可以参考的资源

https://arxiv.org/abs/2212.09420
https://github.com/NL2Code/NL2Code.github.io


Share this note on:

Previous note
cs61a_lec1_function
Next note
Hello World