基础模型(如LLMs)在多种任务上表现出色,但通常需要针对特定任务进行微调。传统微调方法(如LoRA)虽然有效,但需要大量计算资源和对超参数的精细调整。LoRA是一种参数高效的微调方法,通过学习低秩权重矩阵来适应特定任务。这些低秩矩阵作为适配器,可以显著减少需要训练的参数数量。超网络是一种神经网络,能够生成其他网络的参数。T2L技术正是利用了这种超网络的能力,来根据任务描述生成LoRAs适配器。
它是如何做到呢?先看一下效果!
T2L设计上包括以下几个关键部分:
任务嵌入器(Task Encoder):将自然语言任务描述转换为固定维度的嵌入向量。
模块嵌入(Module Embedding):为不同的模块类型(如查询投影和值投影)提供嵌入。
层嵌入(Layer Embedding):为不同的层索引提供嵌入。
多层感知机(MLP):将任务嵌入、模块嵌入和层嵌入组合起来,生成LoRAs适配器的低秩矩阵A和B。
一共包含3种架构变体,它们在输出空间和参数规模上各有不同,具体为:
为每个目标模块(如注意力层、MLP 层)和网络层生成完整的 LoRA 权重矩阵。
T2L-M:
按模块类型(而非具体层)共享输出空间。对于同一类型的模块,超网络仅生成一组共享的LoRA矩阵,并应用于该类型下的所有层。
T2L-S:
为整个模型生成统一的LoRA适配器,不区分模块类型和层索引。
为了训练T2L模型,采用两种训练模式,分别是基于LoRA的重建和跨多个任务的监督微调 (SFT)。
LoRA重建训练(Reconstruction Training):在这种训练方式中,T2L的目标是重建预训练的LoRAs适配器。这允许T2L利用现有的LoRAs库进行训练,并且可以通过自然语言任务描述来生成LoRAs适配器,从而实现对未见任务的零样本适应。
监督微调训练(Supervised Fine-Tuning, SFT):在这种训练方式中,T2L直接在微调数据集上进行优化,而不需要预训练的LoRAs适配器。这种方式允许T2L端到端地学习任务描述与LoRAs适配器之间的映射关系,从而更好地适应新任务。
监督微调本质是使用任务描述,在任务数据集上直接端到端训练T2L。这改进了对未知任务的泛化,并能够根据文本描述生成具有可引导行为的适配器,更适合进行零镜头训练。
为了验证T2L模型技术效果,针对上述两项训练,团队分别进行实验验证。
最终,T2L生成的LoRAs适配器在不同任务上形成了清晰的聚类。相似任务(如MBPP和HumanEval)的LoRAs适配器在投影图中靠近,表明T2L能够根据任务描述生成特定任务的适配器。
直接生成全秩适配器:目前T2L生成的是低秩矩阵A和B,但理论上可以探索直接生成全秩适配器的可能性。这可能需要更复杂的网络结构或训练方法,但有望进一步提升性能。
动态秩调整:研究如何动态调整LoRA的秩,以适应不同任务的复杂性。例如,对于简单任务可以使用较低的秩,而对于复杂任务可以使用较高的秩。
混合训练方法:结合重建训练和监督微调训练的优点,设计一种混合训练方法。例如,先进行重建训练,然后在少量任务上进行监督微调,以进一步提升性能。
元学习方法:探索元学习方法,使T2L能够更快地适应新任务。例如,通过学习任务描述与LoRAs适配器之间的映射关系,T2L可以更高效地生成适配器。
更轻量级的超网络:设计更轻量级的超网络架构,以减少计算开销和参数数量,同时保持性能。
模块化超网络:研究如何将超网络模块化,使其能够更好地处理不同类型的任务。例如,为不同类型的任务设计不同的模块,然后通过任务描述动态选择合适的模块。
稀疏性和量化:研究如何通过稀疏性和量化技术进一步优化T2L的计算效率,使其更适合在资源受限的环境中使用。
分布式训练:探索分布式训练方法,以加速T2L的训练过程,特别是在处理大规模任务数据集时。
Sakana.AI公司专注利用自然启发的方法(如进化计算和集体智能)来开发基础模型,例如在今年5月他们根据达尔文进化论提出了达尔文哥德尔机 (DGM),可以让AI通过读取和修改自身代码来提升编码性能。
Robert T. Lange是Sakana AI的研究科学家和创始成员之一,致力于用基础模型来增强和自动化科学发现过程。他还主导参与了首个独立生成学术论文的“AI科学家”项目,还曾在社区引起广泛热议。
论文则由Rujikorn Charakorn、Edoardo Cetin、Yujin Tang、Robert T. Lange共同完成。
论文链接:https://arxiv.org/abs/2506.06105
代码链接:https://github.com/SakanaAI/Text-to-Lora
参考链接:
[1]https://x.com/RobertTLange/status/1933074366603919638
[2]https://huggingface.co/SakanaAI/text-to-lora/tree/main
[3]https://x.com/tan51616/status/1932987022907670591
[4]https://x.com/SakanaAILabs/stat
服务热线: 010-62128818
Email: deepelement.ai@outlook.com
注册会员开通