ig281 发表于 3 天前

明天有人讲AI课!想预习的看过来!增量学习和在线学习你了解吗?

未来将有讲师前来为我们授课,内容涉及人工智能领域。我久仰此道,正好借此时机整理相关资料,作为课程的提前准备。

首先,AI的模型训练可以分为:

增量学习( )

模型在接收到新数据时能够进行更新,无需对整个模型进行重新训练,这就是增量学习的特点。此方法特别适合那些需要不断适应新数据的场景。不过,并非所有机器学习模型都具备支持增量学习的能力。例如,支持向量机(SVM)和决策树等模型,可以通过特定的策略实现增量更新。然而,对于深度学习模型而言,直接进行增量更新往往较为困难。

在线学习( )

在线学习作为一种独特的逐步增长型学习方式,具备在获取新数据的同时即时更新模型的能力。此类算法擅长应对数据流的处理,并在每一个时间节点上,依据最新获取的数据信息对模型参数进行相应的调整。此方法特别适用于那些数据源源不断产生并要求即时作出反应的应用场景。

模型微调(Fine-)

在深度学习领域,模型微调是一项常见的技术手段,该技术基于预训练模型,并借助新数据进行进一步的训练。一般而言,我们会将预训练模型中的多数层级固定不变,仅对顶层或特定层级进行调整,更新其权重。这样的操作能够让模型在保留从海量数据中汲取的普遍性特征的同时,也能够从新的数据集中学习到特有的属性。

重训练()

若模型无法进行增量或在线学习,那么你可能得借助新的以及原始数据对整个模型进行重新训练。这通常是最直接的处理方式,然而,它也可能耗费大量时间,特别是在数据集规模庞大或模型结构复杂的情况下。

迁移学习( )

迁移学习与模型微调有相似之处,但其核心在于将一个任务中获取的知识有效转移到另一个相关任务中。这一过程通常包括对在大规模数据集上预先训练好的模型进行特定任务的小规模数据集上的调整优化。

https://img0.baidu.com/it/u=1895848006,71655721&fm=253&fmt=JPEG&app=120&f=JPEG?w=500&h=667

AI模型训练大致包含一下几步:

数据的收集

这一块不用说,肯定是要用到网络爬虫技术。

数据的清洗与整理

针对数据的净化与编排,此处展示了一个以新闻报道为内容的经过整理的样本资料。

新闻ID分类标签预处理后的新闻内容

体育

足球世界杯决赛将在本周末举行,两支强队将争夺冠军。

政治

国家领导人接待了远道而来的外国首脑,在会晤中,双方对贸易议题展开了深入的交流与探讨。

娱乐

知名歌手推出了最新专辑,该专辑中的主打曲目已陆续在众多音乐服务平台上正式公开。

特征提取

https://img1.baidu.com/it/u=4070079980,1058835334&fm=253&fmt=JPEG&app=138&f=JPEG?w=500&h=727

特征向量是机器学习可以理解和使用的数值。

下面是一个简单的特征向量的例子:

新闻1的特征向量具体表现为:第一个元素至第八个元素均为1,而后续的元素则全部为0。

不同的模型训练,对向量数据的格式要求不同。

模型训练

常用的库就是

评估和优化

相关的知识点包括:

回顾我之前在博客中谈到的笔记系统计划,我计划采用增量学习的方法,来打造我个人的知识库。每当笔记数据有所更新,就会启动一个队列任务,专门负责提取这些笔记数据,对其进行清洗处理,接着提取关键特征,生成相应的向量数据,最后再进行模型的训练……哎呀,原来这一切都只是个梦。

欢迎大家留言区交流。还望路过的大佬多多指教。

2024.2.23

重庆.渝北
页: [1]
查看完整版本: 明天有人讲AI课!想预习的看过来!增量学习和在线学习你了解吗?