百度在 GitHub 开源了一整套 NLP 技术解决方案,通过结合 PaddleNLP 和 RocketQA 两个 GitHub

百度在GitHub开源了一整套NLP技术解决方案,通过结合PaddleNLP和RocketQA两个GitHub项目,快速实现检索、问答、情感分析等功能。以检索方案为例,具备了低门槛、高精度等特点,数据+代码+模型均已开源。开发者无需标注数据,也能够轻松构建一个检索系统。而问答系统,则可以采用来实现,作为首个开源的中文端到端问答模型,该项目预置了11种模型,让开发者仅需2行命令,即可搭建自己的问答系统。未来几天,他们将开放几场,主要讲解问答系统的技术原理、采用无监督数据快速搭建检索系统、观点抽取与情感分类模型介绍等内容。直播时间:12.28-12.30,每晚20:15-21:30

相关推荐

封面图片

作为当下最受欢迎的开源 AI 大模型解决方案,GitHub 上一个开源项目 Colossal-AI 建立了一整套完整的 RLHF

作为当下最受欢迎的开源AI大模型解决方案,GitHub上一个开源项目Colossal-AI建立了一整套完整的RLHF流程,包括:监督数据集收集->监督微调->奖励模型训练->强化学习微调。并且,技术团队以LLaMA为基础预训练模型,正式推出了ColossalChat,这也是目前最接近ChatGPT原始技术方案的实用开源项目。该项目包括但不限于以下功能:-Demo:可直接在线体验模型效果,无需注册或waitinglist;-训练代码:开源完整RLHF训练代码,已开源至含7B和13B两种模型;-数据集:开源104K中、英双语数据集;-推理部署:4bit量化推理70亿参数模型仅需4GB显存;-模型权重:仅需单台服务器少量算力即可快速复现;-更大规模模型、数据集、其他优化等将保持高速迭代添加。目前,相关代码已开源至GitHub,感兴趣的同学可以看下。项目还有提供完整的中文教程,进一步降低学习门槛,让大家能更快上手开发。

封面图片

百度在 GitHub 开源了一个轻量级图像识别系统:PP-ShiTu,主要解决品类更新频率高、目标区分难度大、算法复杂速度慢等问

百度在GitHub开源了一个轻量级图像识别系统:PP-ShiTu,主要解决品类更新频率高、目标区分难度大、算法复杂速度慢等问题。该系统综合了目标检测、图像分类、度量学习、图像检索等多重技术,在CPU上仅需0.2s,即可轻松识别十万类,且十分简单易用。GitHub:github.com/PaddlePaddle/PaddleClas针对此项目,开发者们将在本周开放几场公开课,主讲图像识别系统概览、SOTA模型炼丹秘诀、商品识别痛点剖析、产业应用案例及落地方案分享等内容。直播时间:11.2-11.5,每晚20:15-21:30

封面图片

一个比较不错的中文大模型解决方案,代码完全开源,无商用限制。

一个比较不错的中文大模型解决方案,代码完全开源,无商用限制。近日,Colossal-AI团队充分利用了LLaMA-2的基础能力,采用高效的训练方法,仅使用约8.5Btoken数据、15小时、数千元的训练成本,成功构建了性能卓越的中文LLaMA-2,在多个评测榜单性能优越。相较于原始LLaMA-2,在成功提升中文能力的基础上,进一步提升其英文能力,性能可与开源社区同规模预训练SOTA模型媲美。该项目在GitHub完全开源了全套训练流程、代码及权重,无商用限制,并提供了一个完整的评估体系框架ColossalEval,以实现低成本的可复现性。不仅如此,相关方案还可迁移应用到任意垂类领域,以及从头预训练大模型的低成本构建。

封面图片

百度技术团队在 GitHub 开源的一套丰富且实用的 #OCR 工具库:PaddleOCR,可帮助开发者快速集成 OCR 功能。

百度技术团队在GitHub开源的一套丰富且实用的#OCR工具库:,可帮助开发者快速集成OCR功能。近期该项目发布了功能更新,主要如下:-优化了超轻量OCR系统PP-OCR效果;-新增表格文字、不规则文字等复杂OCR任务的标注工具;-打通22种OCR不同训练部署软硬件环境与方式;-发布首本交互式OCR全栈电子书《动手学OCR》。针对此项目,开发者将开放3场公开课,主讲OCR技术解析、AI模型训练部署实践、OCR技术产业应用案例、落地方案分享等内容。直播时间:5.11-5.13,每晚20:30

封面图片

最近一个被称为「ChatGPT Plugins国产替代系统」的开源项目在GitHub上星标猛增,该叫BMTools,面壁智能

最近一个被称为「ChatGPTPlugins国产替代系统」的开源项目在GitHub上星标猛增,该项目叫BMTools,面壁智能自研的大模型工具学习引擎。面壁智能联合来自清华、人大、腾讯的研究人员共同发布了中文领域首个基于交互式网页搜索的问答开源模型WebCPM,这一创举填补了国产大模型该领域的空白。面壁智能自研工具学习引擎BMTools也因此被成功实践。BMTools的重要场景,就是使用搜索引擎,开源版本WebCPM工作最近已被ACL2023录用

封面图片

WhatsNS问答系统是一款强大的PHP开源问答系统,能够根据用户的业务需求快速搭建垂直领域的问答平台。该系统内置了强大的采集功

WhatsNS问答系统是一款强大的PHP开源问答系统,能够根据用户的业务需求快速搭建垂直领域的问答平台。该系统内置了强大的采集功能,并支持云存储、图片水印设置、全文检索、站内行为监控、短信注册和通知、伪静态URL自定义以及熊掌号功能。此外,WhatsNS还提供了百度结构化地图(包括标签、问题、文章、分类和用户空间)、PC和Wap模板分离、多套PC和Wap模板等功能,站长可以自由切换。后台还支持模板管理,在线编辑和修改模板,并且具有强大的防灌水拦截和过滤配置等上百项功能。该系统经过深入的SEO优化,非常适合对SEO有需求的站长。通过使用WhatsNS问答系统,用户可以快速搭建自己的问答平台,提升网站的运营效率和用户体验。https://gocodehub.com/2625.html

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人