2022 Python 计算生态五月推荐榜 第51期
![Image](/images/snake.png)
22年5月10日 · Python123 2357 人阅读
![]() |
看见更大的世界,遇见更好的自己
See a better world to meet better for ourselves.
在许多深度学习任务中,如:计算机视觉、自然语言处理等,都会看到预训练的模型(Pretrained model)的身影。预训练模型非常有用,也许我们已经构建自己的卷积神经网络来对图像、字母或数字进行分类,假设尝试对更复杂的图像进行分类时,这些图像由多种颜色组成,朝向不同的位置,或者表现出其他的行为。此时,我们可能不想从头开始构建模型,因为这样做需要大量数据、资源和复杂的架构。这时,就可以从一个经过大量数据集训练并可以预测各种类别的预训练模型开始。通过识别需要在数据上重新训练的神经网络层来重新训练这个预先训练的模型。
2022年05月,预训练模型的研究已经成为一个非常火爆的课题,好事者特别推荐10款优秀的Python计算生态,帮助您了解Python 的预训练模型。
PaddleHub
基于 PaddlePaddle 的预训练模型工具包,300 多个模型,包括图像、文本、音频和视频,易于推理和服务部署。
![]() |
https://github.com/PaddlePaddle/PaddleHub
pytorch-image-models
PyTorch 图像模型、脚本、预训练权重——ResNet、ResNeXT、EfficientNet、EfficientNetV2、NFNet、Vision Transformer、MixNet、MobileNet-V3/V2、RegNet、DPN、CSPNet 等。
https://github.com/rwightman/pytorch-image-models
spleeter
Deezer 源分离库,包括预训练模型。
![]() |
https://github.com/deezer/spleeter
CLIP
CLIP(Contrastive Language-Image Pre-Training)是一个在各种(图像、文本)对上训练的神经网络。可以用自然语言指示给定图像来预测最相关的文本片段,而无需直接针对任务进行优化,类似于 GPT-2 和 3 的零样本能力。
https://github.com/openai/CLIP
segmentation-models-pytorch
基于PyTorch的带有神经网络的 Python 库,用于图像分割。
![]() |
https://github.com/qubvel/segmentation_models.pytorch
ONNX
ONNX(Open Neural Network Exchange)是一种针对机器学习所设计的开放式的文件格式,用于存储训练好的模型。它使得不同的人工智能框架(如Pytorch、MXNet)可以采用相同格式存储模型数据并交互。
https://github.com/onnx/models
facenet-pytorch
预训练的 Pytorch 人脸检测
(MTCNN) 和人脸识别 (InceptionResnet) 模型。
https://github.com/timesler/facenet-pytorch
XLM
跨语言语言模型预训练的 PyTorch 原始实现。
https://github.com/facebookresearch/XLM
Pretrained-Language-Model
该库提供了华为诺亚方舟实验室开发的最新预训练语言模型及其相关优化技术。
https://github.com/huawei-noah/Pretrained-Language-Model
spacy-transformers
在 spacey 中使用预训练的转换器,例如 BERT、XLNet
和 GPT-2。
Python3Turtle