NLP 知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)
NLP 知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)
这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习。
1. 信息抽取项目合集
1.PaddleNLP 之 UIE 技术科普【一】实例:实体识别、情感分析、智能问答https://aistudio.baidu.com/aistudio/projectdetail/4180615?contributionType=1
NLP 领域任务选择合适预训练模型以及合适的方案【规范建议】【ERNIE 模型首选】https://aistudio.baidu.com/aistudio/projectdetail/4888188?contributionType=1
Paddlenlp 之 UIE 模型实战实体抽取任务【打车数据、快递单】https://aistudio.baidu.com/aistudio/projectdetail/4321385?contributionType=1
快递单信息抽取【二】基于 ERNIE1.0 预训练模型https://aistudio.baidu.com/aistudio/projectdetail/4157455?contributionType=1
快递单信息抽取[三]:Ernie 1.0 至 ErnieGram + CRF 改进算法https://aistudio.baidu.com/aistudio/projectdetail/4159638?contributionType=1
UIE 之快递单信息抽取【四】--小样本标注数据提高准确率https://aistudio.baidu.com/aistudio/projectdetail/4160432?contributionType=1
Paddlenlp 之 UIE 关系抽取模型【高管关系抽取为例】https://aistudio.baidu.com/aistudio/projectdetail/4371345?contributionType=1
文档级关系抽取模型:基于结构先验产生注意力偏差 SSAN 模型https://aistudio.baidu.com/aistudio/projectdetail/4666541?contributionType=1
基线提升至 96.45%:2022 司法杯犯罪事实实体识别+数据蒸馏+主动学习https://aistudio.baidu.com/aistudio/projectdetail/4911042?contributionType=1
[信息抽取]基于 ERNIE3.0 的多对多信息抽取算法:属性关系抽取https://aistudio.baidu.com/aistudio/projectdetail/5143572?contributionType=1
基于 ERNIELayout&PDFplumber-UIEX 多方案学术论文信息抽取https://aistudio.baidu.com/aistudio/projectdetail/5196032?contributionType=1
2.文本分类意图识别项目合集
应用实践:分类模型大集成者[PaddleHub、Finetune、prompt]https://aistudio.baidu.com/aistudio/projectdetail/4357474?contributionType=1
小样本学习分类任务:在文心 ERNIE3.0 应用(提示学习),提速提效快用起来!https://aistudio.baidu.com/aistudio/projectdetail/4438610?contributionType=1
2022 CCF 大数据与计算智能大赛:小样本数据分类任务 baselinehttps://aistudio.baidu.com/aistudio/projectdetail/4479243?contributionType=1
Paddlenlp 之 UIE 分类模型【以情感倾向分析新闻分类为例】含智能标注方案)https://aistudio.baidu.com/aistudio/projectdetail/4337189?contributionType=1
基于 ERNIR3.0 文本分类:(KUAKE-QIC)意图识别多分类(单标签)https://aistudio.baidu.com/aistudio/projectdetail/4362154?contributionType=1
基于 Ernie-3.0 CAIL2019 法研杯要素识别多标签分类任务https://aistudio.baidu.com/aistudio/projectdetail/4280922?contributionType=1
基于 ERNIR3.0 文本分类:CAIL2018-SMALL 罪名预测为例(多标签)https://aistudio.baidu.com/aistudio/projectdetail/4374631?contributionType=1
基于 ERNIR3.0 文本分类:WOS 数据集为例(层次分类)https://aistudio.baidu.com/aistudio/projectdetail/4382251?contributionType=1
3.模型性能提升项目合集
在数据增强、蒸馏剪枝下 ERNIE3.0 模型性能提升详细方案https://aistudio.baidu.com/aistudio/projectdetail/4436131?contributionType=1
Paddle 模型性能分析工具 Profiler:定位瓶颈点、优化程序、提升性能https://aistudio.baidu.com/aistudio/projectdetail/4482932?contributionType=1
可视化分析工具 VisualDL 2.4 强势来袭!新增:动态图模型可视化和性能分析https://aistudio.baidu.com/aistudio/projectdetail/4561034?contributionType=1
推广 TrustAI 可信分析:通过提升数据质量来增强在 ERNIE 模型下性能https://aistudio.baidu.com/aistudio/projectdetail/4622139?contributionType=1
AiTrust 下预训练和小样本学习在中文医疗信息处理挑战榜 CBLUE 表现https://aistudio.baidu.com/aistudio/projectdetail/4592515?contributionType=1
UIE Slim 满足工业应用场景,解决推理部署耗时问题,提升效能!https://aistudio.baidu.com/aistudio/projectdetail/4516470?contributionType=1
主动学习(Active Learning)综述以及在文本分类和序列标注应用https://aistudio.baidu.com/aistudio/projectdetail/4897371?contributionType=1
4.知识图谱项目合集
技术知识介绍:工业级知识图谱方法与实践https://aistudio.baidu.com/aistudio/projectdetail/4444783?contributionType=1
特定领域知识图谱融合方案:技术知识前置【一】-文本匹配算法https://aistudio.baidu.com/aistudio/projectdetail/5398069?contributionType=1
特定领域知识图谱(Domain-specific KnowledgeGraph:DKG)融合方案(重点!)
在前面技术知识下可以看看后续的实际业务落地方案和学术方案
关于图神经网络的知识融合技术学习参考下面链接:PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]
从入门知识到经典图算法以及进阶图算法等,自行查阅食用!
文章篇幅有限请参考专栏按需查阅:NLP知识图谱相关技术业务落地方案和码源
4.1 特定领域知识图谱知识融合方案(实体对齐):优酷领域知识图谱为例
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128614951
4.2 特定领域知识图谱知识融合方案(实体对齐):文娱知识图谱构建之人物实体对齐
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128673963
4.3 特定领域知识图谱知识融合方案(实体对齐):商品知识图谱技术实战
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128674429
4.4 特定领域知识图谱知识融合方案(实体对齐):基于图神经网络的商品异构实体表征探索
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128674929
4.5 特定领域知识图谱知识融合方案(实体对齐)论文合集
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128675199
论文资料链接:两份内容不相同,且按照序号从小到大重要性依次递减
知识图谱实体对齐资料论文参考(PDF)+实体对齐方案+特定领域知识图谱知识融合方案(实体对齐)
知识图谱实体对齐资料论文参考(CAJ)+实体对齐方案+特定领域知识图谱知识融合方案(实体对齐)
4.6 知识融合算法测试方案(知识生产质量保障)
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128675698
5.图神经网络
1.1 关于图计算 &图学习的基础知识概览:前置知识点学习(PGL)[系列一] :https://aistudio.baidu.com/aistudio/projectdetail/4982973?contributionType=1
本项目对图基本概念、关键技术(表示方法、存储方式、经典算法),应用等都进行详细讲解,并在最后用程序实现各类算法方便大家更好的理解。当然之后所有图计算相关都是为了知识图谱构建的前置条件
1.2 图机器学习(GML)&图神经网络(GNN)原理和代码实现(前置学习系列二)https://aistudio.baidu.com/aistudio/projectdetail/4990947?contributionType=1
现在已经覆盖了图的介绍,图的主要类型,不同的图算法,在 Python 中使用 Networkx 来实现它们,以及用于节点标记,链接预测和图嵌入的图学习技术,最后讲了 GNN 分类应用以及未来发展方向!
1.3 图学习初探 Paddle Graph Learning 构建属于自己的图【系列三】https://aistudio.baidu.com/aistudio/projectdetail/5000517?contributionType=1
本项目主要讲解了图学习的基本概念、图的应用场景、以及图算法,最后介绍了 PGL 图学习框架并给出 demo 实践,过程中把老项目 demo 修正版本兼容问题等小坑,并在最新版本运行便于后续同学更有体验感
1.4 PGL 图学习之图游走类 node2vec、deepwalk 模型[系列四]https://aistudio.baidu.com/aistudio/projectdetail/5002782?contributionType=1
介绍了图嵌入原理以及了图嵌入中的 DeepWalk、node2vec 算法,利用 pgl 对 DeepWalk、node2vec 进行了实现,并给出了多个框架版本的 demo 满足个性化需求。
图学习【参考资料 1】词向量 word2vec https://aistudio.baidu.com/aistudio/projectdetail/5009409?contributionType=1
介绍词向量 word2evc 概念,及 CBOW 和 Skip-gram 的算法实现。
图学习【参考资料 2】-知识补充与 node2vec 代码注解https://aistudio.baidu.com/aistudio/projectdetail/5012408?contributionType=1
主要引入基本的同构图、异构图知识以及基本概念;同时对 deepWalk 代码的注解以及 node2vec、word2vec 的说明总结;(以及作业代码注解)
1.5 PGL 图学习之图游走类 metapath2vec 模型[系列五]https://aistudio.baidu.com/aistudio/projectdetail/5009827?contributionType=1
介绍了异质图,利用 pgl 对 metapath2vec 以及 metapath2vec 变种算法进行了实现,同时讲解实现图分布式引擎训练,并给出了多个框架版本的 demo 满足个性化需求。
1.6 PGL 图学习之图神经网络 GNN 模型 GCN、GAT[系列六] [https://aistudio.baidu.com/aistudio/projectdetail/5054122?contributionType=1](https://aistudio.baidu.com/aistudio/projectdetail/5054122?contributionType=1)
本次项目讲解了图神经网络的原理并对 GCN、GAT 实现方式进行讲解,最后基于 PGL 实现了两个算法在数据集 Cora、Pubmed、Citeseer 的表现,在引文网络基准测试中达到了与论文同等水平的指标。
1.7 PGL 图学习之图神经网络 GraphSAGE、GIN 图采样算法[系列七] https://aistudio.baidu.com/aistudio/projectdetail/5061984?contributionType=1
本项目主要讲解了 GraphSage、PinSage、GIN 算法的原理和实践,并在多个数据集上进行仿真实验,基于 PGl 实现原论文复现和对比,也从多个角度探讨当前算法的异同以及在工业落地的技巧等。
1.8 PGL 图学习之图神经网络 ERNIESage、UniMP 进阶模型[系列八]https://aistudio.baidu.com/aistudio/projectdetail/5096910?contributionType=1
ErnieSage 可以同时建模文本语义与图结构信息,有效提升 Text Graph 的应用效果;UniMP 在概念上统一了特征传播和标签传播, 在 OGB 取得了优异的半监督分类结果。
PGL 图学习之 ERNIESage 算法实现(1.8x 版本)【系列八】https://aistudio.baidu.com/aistudio/projectdetail/5097085?contributionType=1
ERNIESage 运行实例介绍(1.8x 版本),提供多个版本 pgl 代码实现
1.9 PGL 图学习之项目实践(UniMP 算法实现论文节点分类、新冠疫苗项目)[系列九]https://aistudio.baidu.com/aistudio/projectdetail/5100049?contributionType=1
本项目借鉴了百度高研黄正杰大佬对图神经网络技术分析以及图算法在业务侧应用落地;实现了论文节点分类和新冠疫苗项目的实践帮助大家更好理解学习图的魅力。
PGL 图学习之基于 GNN 模型新冠疫苗任务[系列九]https://aistudio.baidu.com/aistudio/projectdetail/5123296?contributionType=1
图神经网络 7 日打卡营的新冠疫苗项目拔高实战
PGL 图学习之基于 UniMP 算法的论文引用网络节点分类任务[系列九]https://aistudio.baidu.com/aistudio/projectdetail/5116458?contributionType=1
基于 UniMP 算法的论文引用网络节点分类,在调通 UniMP 之后,后续尝试的技巧对于其精度的提升效力微乎其微,所以不得不再次感叹百度 PGL 团队的强大!
PGL 图学习项目合集 &数据集分享 &技术归纳业务落地技巧[系列十]https://aistudio.baidu.com/aistudio/projectdetail/5127575?contributionType=1
6.其他项目
强化学习
【强化学习项目一】搭建自己的寻宝游戏环境(Qlearning)https://aistudio.baidu.com/aistudio/projectdetail/2006781?contributionType=1
MADDPG 多智能体深度强化学习算法算法实现(parl)--【追逐游戏复现】https://aistudio.baidu.com/aistudio/projectdetail/1864915?contributionType=1
使用 TD3 解决四轴飞行器悬浮任务https://aistudio.baidu.com/aistudio/projectdetail/1705633?contributionType=1
深度学习
【深度学习项目一】全连接神经网络实现手写数字识别https://aistudio.baidu.com/aistudio/projectdetail/1926913?contributionType=1
深度学习项目二】卷积神经网络 LeNet 实现手写数字识别https://aistudio.baidu.com/aistudio/projectdetail/1928935?contributionType=1
【深度学习项目三】ResNet50 多分类任务【十二生肖分类】https://aistudio.baidu.com/bd-cpu-01/user/691158/5427356/home#codelab
『深度学习项目四』基于 ResNet101 人脸关键点检测https://aistudio.baidu.com/aistudio/projectdetail/1932295?contributionType=1
【深度学习项目五】:利用 LSTM 网络进行情感分析https://aistudio.baidu.com/aistudio/projectdetail/1994431?contributionType=1
༄ℳ持续更新中ꦿོ࿐
版权声明: 本文为 InfoQ 作者【汀丶】的原创文章。
原文链接:【http://xie.infoq.cn/article/c23fce6b0746e70f921b79090】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论