本周优秀开源项目分享,面罩检测系统、基于CTC的语言识别系统 、OCR工具包等8大项目

七月在线实验室

共 4602字,需浏览 10分钟

 · 2020-08-15



01

 Face-Mask-Detection 使用OpenCV和Tensorflow / Keras基于计算机视觉和深度学习的面罩检测系统


使用OpenCV,Keras / TensorFlow使用深度学习和计算机视觉概念构建的面罩检测系统,用于检测静态图像以及实时视频流中的面罩。



在当前情况下(由于Covid-19),没有高效的口罩检测应用程序,现在对运输工具,人口稠密的地区,居民区,大型制造商和其他企业的需求很高,以确保安全。此外,由于缺少“ with_mask”图像的大型数据集,因此该任务更加繁琐且具有挑战性。


我们的面罩检测器未使用任何变形的蒙版图像数据集。该模型是准确的,并且由于我们使用了MobileNetV2架构,因此它的计算效率也很高,因此可以更轻松地将模型部署到嵌入式系统(Raspberry Pi,Google Coral等)。


因此,由于Covid-19的爆发,该系统可用于出于安全目的而需要检测面罩的实时应用。该项目可以与嵌入式系统集成,以在机场,火车站,办公室,学校和公共场所中应用,以确保遵守公共安全准则。


项目地址:

https://github.com/chandrikadeb7/Face-Mask-Detection


02 

 gan-jittor 基于Pytorch-GAN的代码GAN模型库


我们的GAN模型动物园支持27种GAN。下表是我们从Google学术搜索中找到的最新引用。可以看出,自GAN于2014年提出以来,许多基于GAN的优秀作品已经出现。这27个GAN总共被引用60953次,每篇文章平均被引用2176次。


我们比较了Jittor和Pytorch的这些GAN的性能。下图是Jittor相对于Pytorch的加速比。可以看出,这些GAN的最高加速比达到283%,平均加速比为185%。



模型包括:



项目地址:

https://github.com/Jittor/gan-jittor


03 

 Stock_Analysis_For_Quant Python,R,Matlab,Excel,Power BI中的不同类型的股市分析



这是Excel,Power BI,Matlab,Python和R语言的股票分析项目,具有不同类型的分析,例如数据分析,技术分析,基础分析,定量分析和不同类型的交易策略。


另外,这是用于贸易和投资中的定量研究和分析。定量分析(QA)是一种使用数学和统计模型,度量和研究来理解财务行为的技术。Excel,Python和R语言中的许多不同类型的技术指标和库存策略。


在不同类型的编程语言中为该研究项目使用时间序列,预测,机器学习和深度学习。


系统需求:

Python 3.5+

R 3.0.0 +

Matlab R2016a

Excel 2016

Power BI


功能列表:

交易策略:有多种方法可以用来完成不同的策略。因此,每个市场都有适当的市场环境和策略固有的风险。交易策略是一种基于用于制定交易决策的预定义规则在市场上买卖的技术。


投资组合策略:投资组合策略是投资者使用其资产实现其财务目标的一种投资方法。


风险:风险度量是用于定义单个股票或一起执行风险评估的统计方法。


风险调整后的收益率衡量:风险调整后的回报率是一种投资回报,它通过衡量产生该回报的风险程度来确定。


项目地址:

https://github.com/LastAncientOne/Stock_Analysis_For_Quant


04 
 texthero 从零开始的文本预处理,表示和可视化。


Texthero是一个Python工具箱,可快速轻松地处理基于文本的数据集。Texthero非常简单易学,可以在Pandas上使用。 


Texthero具有与Pandas相同的表现力和力量,并有大量文献记载。Texthero是现代的,面向2020年代的程序员。


您可以将Texthero视为帮助您了解和使用基于文本的数据集的工具。给定一个表格数据集,很容易掌握主要概念。相反,在给定文本数据集的情况下,很难快速了解下划线数据。


使用Texthero,预处理文本数据,将其映射到向量中以及可视化所获得的向量空间仅需几行。


Texthero包含以下工具:

预处理文本数据:它提供了即用型解决方案,但对于自定义解决方案也很灵活。


自然语言处理:关键短语和关键字提取,以及命名实体识别。


文本表示形式:TF-IDF,词频和自定义词嵌入(wip)


向量空间分析:聚类(K均值,Meanshift,DBSCAN和Hierarchical),主题建模(wip)和解释。


文本可视化:向量空间可视化,将本地化放置在地图上(WIP)。

Texthero是免费的,开源的并且有据可查的。


项目地址:

https://github.com/jbesomi/texthero


05

  CTC_pytorch pytorch的基于CTC的语音识别系统


数据集:

英语语料库:Timit

训练集:3696个句子(不包括SA语音)

开发集合:400个句子

测试集:192个句子

中文语料库:863语料库


模型:

RNN + DNN + CTC 

CNN + RNN + DNN + CTC


系统安装:

安装Pytorch

安装Kaldi,我们使用kaldi提取mfcc和fbank。

安装pytorch torchaudio(使用波形作为输入时需要)

安装并启动visdom


项目地址:

https://github.com/Diamondfan/CTC_pytorch


06

  cnocr 中英文OCR工具包


cnocr 是 Python 3 下的中英文OCR工具包,自带了多个训练好的识别模型(最小模型仅 4.7M),安装后即可直接使用。


cnocr 主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。目前内置的文字检测和分行模块无法处理复杂的文字排版定位。


如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用,例如同样基于 MXNet 的文字检测引擎 cnstd 。



cnocr v1.2 目前包含以下可直接使用的模型,训练好的模型都放在 cnocr-models 项目中,可免费下载使用:



项目地址:

https://github.com/breezedeus/cnocr


07

  Multilingual_Text_to_Speech 多语言语音合成


该存储库为论文“ One Model, Many Languages: Meta-learning for Multilingual Text-to-Speech.”提供了综合的样本,训练和评估数据,源代码和参数。


项目包含Tacotron 2的实现,该实现支持多语言实验并且实现了不同的编码器参数共享方法。


它提出了一个模型,该模型结合了“学习以流利的外语进行交流”的思想:多语言语音合成和跨语言语音克隆,具有单语言记录混合的端到端代码转换TTS以及用于通用神经机器翻译的上下文参数生成。



我们提供了用于比较三种多语言文本到语音模型的数据。第一个共享整个编码器,并使用对抗性分类器从编码器中删除说话者相关的信息。


第二种针对每种语言具有单独的编码器。最后,第三种方法是我们尝试结合先前两种方法中的最佳方法,即第一种方法的有效参数共享和第二种方法的灵活性。


它具有一个全卷积编码器,具有由参数生成器生成的特定于语言的参数。它还利用遵循领域对抗训练原理的对抗说话者分类器。参见上图。


项目地址:

https://github.com/Tomiinek/Multilingual_Text_to_Speech


08

  PyAnomaly 视频异常检测

视频异常检测是CV中的一项基本任务,在监控中具有广泛的应用。但是,我们没有像detectron2或mmdet这样的存储库,它们可以收集有用的算法复制信息。


我们认为造成这些挑战的原因是:

异常检测算法未明确划分

该算法没有统一的框架


为了解决这些问题并推动视频异常检测的发展,我们开发了此项目。在进行此项目时,我们会参考其他任务存储库,例如detectron2,以使我们的存储库尽可能灵活,这对于添加新功能很方便。



每个包装的功能:


核心软件包在lib软件包中。我们基于* Anomaly Detection *的常规功能在lib内部显式构建软件包,这些常规功能是config,core,datatools,loss,networks和utils。


期望这些软件包在lib中。其他文件夹不是python软件包,它们是用于存储用户数据的文件夹,例如data文件夹用于存储数据,experiment文件夹用于存储配置,输出是用于存储日志文件,模型等。


Config 该软件包仅包含一个文件config.py,该文件定义了默认配置。在实际使用过程中,我们仅更改此文件。我们仅在实验中更改YAML文件。


Core 该软件包包含整个项目的核心功能,即固定的训练和推理方法。每个文件都是模块的单独训练或方法的推理。


Datatools 该软件包包含数据部分的核心代码,包括读取数据并进行扩充。该软件包还包含增强部分和评估部分。


Loss 该软件包包含我们项目中使用的损失函数,用户可以使用其损失函数。


Networks 该软件包包含整个项目的模型结构。


Utils 该软件包包括我们在整个项目中经常使用的工具,例如接收CMD参数,创建记录器,创建张量板等。大多数情况下,用户不需要更改此软件包中的文件。


项目地址:

https://github.com/YuhaoCheng/PyAnomaly


今日福利

近期我们上线了SVM与XGBoost特训】第三期课程,在售价119.9元的课程,限时9.9元秒(机器学习集训营预习课之一)


大家可以看下本期课程的大纲,满满的干货,特别适合新手用来入门。



共两大实战项目


理论和实践完美结合,通过全套的视频讲解,帮你在脑海中搭建模型的基本框架,让你彻底搞懂每一个知识点,从而提高你写代码的速度。


课程包括完善的【大咖亲授教学】+【助教答疑】+【班主任督学】+【免费CPU云平台】+【职业规划师1V1规划学习路径服务,确保每一位小伙伴都能愉快的学习知识。


通过本期课程,你将有以下收获:


除此之外:

大家学习中有任何问题都可以在群内提问,12小时内保证解决问题!不怕学不会,老师全程跟踪辅导、答疑,班主任督促学习,群内学员一起学习!


免费积累行业、人脉和经验。有什么比一边学习一边认识到各行各业的同学更开心的事呢?上课时,是同学;下课了,这些全是你的人脉!


课程进行四分之三时,还会邀请行业大咖进行免费直播公开课!


看到这里,估计想学习的读者已经迫不及待要报名了。


在售价119.9元的课程,今天大家可以使用优惠券按照9.9元购买,有兴趣的小伙伴抓紧抢购,先报先占位!


扫码进群领优惠券???


如果你正想要学习机器学习,那么一定要学习下这门课,学会些理论和实战经验还是很值得的!

一顿早餐的价钱,换你一次迈入高薪技术领域的机会!

阅读原文”查看课程详情!(机器学习集训营预习课之一)

浏览 28
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报