3月17日,微软公司宣布推出办公“智能副驾”Microsoft 365Copilot,Copilot能够将大型语言模型(LLM)的强大功能与业务数据和Microsoft 365应用相结合。
点评:
1、Copilot通过“三个部分”+“两种方式”进行服。Microsoft365 Copilot主要由Microsoft 365、Microsoft Graph和大语言模型三部分组成;其将通过两种方式协助客户工作,1)通过将Copilot内置到Microsoft 365应用中,包括Word、Excel、PowerPoint、Teams等;2)通过新功能Business Chat,其汇集了来自多个来源的信息,可以应用于大型语言模型、Microsoft 365应用以及用户的日历、电子邮件等,实现生成总结、会议纪要、导入其他应用等功能。
2、Copilot有望重塑用户生产力。Copilot带来了全新的工作方式,在Word中可以实现与用户共同创作,在Excel中可以帮助用户识别趋势及短时间内数据可视化,在PowerPoint中可以将自然语言命令转化为演示文稿,释放用户工作量,显著提升用户的工作流畅性。同时,基于微软对企业数据安全和隐私的承诺,有望受到大量企业用户的青睐,市场前景广阔。
3、AI技术持续升级,应用场景不断扩大。OpenAI最新发布的GPT-4多模态预训练模型已经可以接受文本和图像的输入方式,随着多模态模型的升级迭代,AI适用性将显著提升,或能够满足办公、游戏等不同场景的特殊需求,甚至在语音、视频等方面获得突破,有望实现应用场景的更大扩展。
随着微软发布了Microsoft 365Copilot,GPT4的炒作又有了新方向,机构强推AI工具办公软件开始发酵,彩讯股份大涨19个点,金山办公最高涨幅接近20个点,福昕软件最高涨幅20个点,万兴科技涨幅最小但是2天最高涨幅也有接近20个点。无论是未来国产办公软件的自强,还是GPT4的炒作路径传导到了应用端,GPT4必然是人工智能题材二波的核心,下面给老师们推荐一个具有极大预期差的AI办公软件股,他就是汉仪股份,流通市值只有7亿,位置和盘子都极小具有极大爆发潜力的一个市场低估值潜力票!最近GPT4相关的逻辑正宗的小票和大票齐飞!青木股份2天狂拉30多个点,易点天下2天也是狂拉20多个点!而汉仪股份值得期待!
首先是汉仪股份的招股说明书对标公司就是金山办公、福昕软件和万兴科技
其次纵观整个A股能拥有PDF办公软件的只有4个公司,他们分别是汉仪股份、金山办公、福昕软件和万兴科技,其中后面3个机构和市场都比较了解,只不过汉仪股份是最新加入到办公软件行业的新贵,市场还未充分挖掘!
随着社会经济的发展,无纸化办公逐渐成为各行各业的大势所趋,用户对于数字文档的功能、易用性、协同办公、云存储等需求也越来越丰富和迫切。PDF格式作为电子文档最终的形态格式,在任何设备上都可以保证其显示和打印效果高度精确并具有更好的安全性,适用于如设计、印刷、公文、证照、凭据、教育和文档流转等广泛应用场景,其目标用户也从B端逐步下沉到更为广泛的C端群体。另一方面,国内各行业企业对于国产自主开发的信息技术应用软件创新的需求更为迫切,自主可控和信息安全也提升到了前所未有的高度,国产自主PDF软件将迎来难得的发展机遇。UPDF作为一款完全自主产权的国产版式文档编辑软件,功能强大,使用便捷,提供包括PDF阅读、编辑、注释、生成、搜索、存储、安全分发等在内的一站式创新技术与优质服务,可以帮助个人用户和企业进一步提升办公效率、降低运营成本。赛博爱思核心团队成员都有超过十年的行业实战经验,拥有较强的研发、产品、运营和营销能力。UPDF发展速度较快,自2022年5月推出上线至今已形成覆盖PC端、Mac端、移动端等多条产品线
然后我简单的跟大家介绍这款UPDF软件,首先是这款UPDF软件已经可以再全球200多个国家和地区下载,而且UPDF软件功能十分强大,更主要的UPDF软件和其他的PDF看起来更时尚,界面简洁漂亮,更受年轻人喜欢!
赛博爱思(上海)软件科技有限公司(以下简称「赛博爱思」)宣布完成数千万元Pre-A轮投资,本轮融资由汉仪股份领投,禾光投资和谷川资本跟投。本轮融资资金将主要用于产品研发、团队建设以及市场推广等方面。「赛博爱思」成立于2021年9月,是一家面向全球用户,提供以PDF文档为载体的文档编辑和内容创作的SaaS公司。其推出的明星产品“UPDF”于2022年7月正式上线。作为一款完全自主产权的国产版式文档编辑软件,多功能 PDF 阅读器“UPDF”适用于桌面端和移动用户,不仅可以帮助用户阅读和编辑 PDF 文件,也可以注释和管理 PDF 文档。
近几年,随着无纸化办公和远程办公方式的兴起,作为版式文档的PDF需求量呈高速增长态势。「赛博爱思」创始人Roc介绍,Google Trends版式PDF的热度是流式文档office的1.3倍,这一行业年复合增长率可以达到30%。正是因为看到行业尚有巨大的发展机会,有过10+年工具产品和上市公司事业部总经理经验的Roc,组建了一个超10年以上PDF行业从业经验的核心班底,核心成员都来自万兴、华为、腾讯等,有较强的PDF研发管理和海外市场营销经验。
市场有需求,但行业也存在较为“突出”的痛点。目前市场上的PDF文档都以堆积功能为主,忽略了用户在使用中的实际需求和操作体验。传统厂商只停留在文档阅读和编辑工具上,没有在内容模板、协同工作方面延展。价格方面,由于行业属于卖方市场,订阅价格普遍较高,年费平均都在500元左右。
基于这些痛点,“UPDF”在产品上做出了很多调整。在功能上,相比行业内其他厂商140多种使用功能,“UPDF”将功能精简到40多种,更加聚焦在阅读、批注、编辑、表单、批量工具、电子签名等核心功能的使用体验。在渲染技术上,“UPDF”将游戏的渲染引擎用在了文档处理上,提高了使用效率。
Roc介绍,“在工业制造行业,使用的文件通常都是比较大。我们曾做过一组测试,打开一个5G的PDF文档,有的厂商产品至少需要10秒时间,也有的厂商直接卡顿崩溃了,而我们UPDF只需要3-4秒。”除此之外,区别于行业内的其他厂商,“UPDF”实现了跨平台操作,具有很强的兼容性。
行业内的其他厂商都是按照端口来收费,也就说同一账号不支持多个设备登陆的,而“UPDF”打通了所有端口,一个账号即可解锁Windows、MacOS、IOS、Android等不同设备,用户无需重复购买。
PDF文档是目前应用最广泛的版式文档格式之一,它与Word为代表的流式文档组成办公软件双子星。PDF文档生成结构、转换过程复杂,且编辑难度大,具有较高的技术壁垒。也正是这个原因,全球仅有少数软件企业掌握了完整的PDF格式生成、渲染、转换与版面识别等关键技术。目前,在全球PDF市场份额中,Adobe尚处于一家独大的态势,占据市场一半以上的市场份额,国内厂商分到的蛋糕仍旧较小。
除了面向C端消费者,“UPDF”还会面向B端,为一些政企部门提供数字资产管理的解决方案。联合创始人Craig介绍,一些大型企业都存在文档保存困难的痛点,许多企业都有构建自己数字资产的需求。“UPDF”可以帮助他们完成文档的全流程记录和存储,实现协同办公、协同管理。这也是“UPDF”区别于从传统to C厂商非常重要的一点,引入文档管理服务的理念去提升B端用户的产品粘性。
未来,内容创造也会是“UPDF”的一个发展方向。利用现阶段最新的ChatGPT和文言一心大模型等给UPDF软件赋予新的功能,相比操作更为自由的流式文档,PDF往往更倾向于二次创作,但由于技术的更加成熟,目前PDF的编辑自由度已经可以和流式文档相媲美。“UPDF”计划将根据用户的不同职业特点,通过AI精准推送适合用户的模板,协助用户更好地进行内容创作。
PDF版式文档是数字内容的最终载体之一,也是关键的基础应用软件。非常看好UPDF团队在研发、产品、运营、营销和出海方面的能力,真正从用户需求出发打磨和迭代产品,为版式文档的应用创造各种新的可能。作为一款完全自主可控的国产PDF软件,希望公司可以抓住市场机会,成为国内SaaS模式下产品驱动增长(PLG)的典型代表以及国内信创行业的新生力量。
通过这几款软件的截图对比可以看出来,汉仪股份的UPDF软件的UI界面是做的最好看的,万兴科技的PDF软件做的也可以,金山办公和福昕软件的PDF软件一看就是办公软件的常用界面,没有太多特点
而且汉仪股份的UPDF软件的创始团队都来自万兴科技,华为和腾讯的核心员工,全部是国内大厂,品质有保证!
然后周末还发酵了华为的ERP题材
华为正式官宣进军ERP 市场。3 月17 日,华为创始人任正非在“难题揭榜”火花奖公司内外的获奖者及出题专家座谈会上表示,2023年4 月份 MetaERP 将会宣誓,完全用自己的操作系统、数据库、编译器和语言,做出了自己的管理系统MetaERP 软件。MetaERP 已经历了公司全球各部门的应用实战考验,经过了华为的总账使用年度结算考验,已成功地证明MetaERP 是有把握推广的。这是在市场传言已久后,华为首次官方口径承认MetaERP 存在,并且在官方口径认可未来MetaERP 即将面向市场推广。
汉仪股份募投项目之一就是ERP、CRM信息化管理项目!而且汉仪股份有华为、华为鸿蒙和华为汽车概念
ERP营销服务信息化系统建设项目然后周末还有老师科普发酵了MLOps概念,下面也顺便给老师们科普下汉仪股份的MLOps概念和逻辑:
MLOps是将DevOps方法论扩展到包括机器学习和数据科学资产作为DevOps生态系统中的一流公民的过程。从各类ML资产的角度,例如特征、模型等角度出发,可以分析MLOps中的一些需求与挑战。汉仪股份是中国A股字库软件第一股,服务于华为、阿里巴巴、腾讯等客户,为其提供各种字体服务。汉仪股份的产品覆盖各种应用场景、各种数据终端的全部用字需求,且仍在持续产出新的优质字体。以下是关于汉仪股份在MLOps方面的逻辑分析:
MLOps对于汉仪股份的业务具有重要意义,可以帮助汉仪股份构建一个高效、可靠、可重复和安全的机器学习流程,从而提高其字体生成算法的质量和效率。
除此之外汉仪股份的题材还有知识产权保护、AIGC、华为、华为汽车、鸿蒙概念、人工智能、腾讯等题材,而且未来GPT4人工智能模型的发展离不开大数据和数据合成!
证监会科技监管局局长姚前:建议重点发展基于AIGC技术的合成数据产业】
3月7日电,中国证监会科技监管局局长姚前在《中国金融》杂志撰文称,建议重点发展基于AIGC技术的合成数据产业。以更高效率、更低成本、更高质量为数据要素市场“增量扩容”,助力打造面向人工智能未来发展的数据优势。在强化数据要素优质供给方面,应统筹兼顾自立自强和对外开放。可考虑对Wikipedia、Reddit等特定数据源建立过滤后的境内镜像站点,供国内数据处理者使用。
Gartner:2024~2030年60%至几乎所有的大模型数据都是“合成数据”
ChatGPT类大模型训练数据的托管与治理痛点:巧妇难为无米之炊
有研究预测,按照目前的发展速度,到2026年ChatGPT类大模型的训练将耗尽互联网上的可用文本数据,届时将没有新的训练数据可供使用。因此,算力瓶颈之外,训练数据将成为大模型产业化的最大掣肘之一。从更深层次考虑,大模型在训练数据方面还存在各种治理问题,比如数据采集标注费时费力成本高、数据质量较难保障、数据多样化不足难以覆盖长尾和边缘案例、特定数据在获取与使用分享等方面存在隐私保护、数据偏见等问题。
OpenAI虽没有直接公开ChatGPT的相关训练数据来源和细节,但可以从近些年业界公布过的其他大模型(如DeepMind发布的2800亿参数大模型Gopher)的训练数据推测出ChatGPT的训练数据来源
总的来看,大模型的训练数据主要来自于维基百科(Wikipedia)、书籍(Books)、期刊(Journals)、Reddit社交新闻站点、Common Crawl和其他数据集。数据的质量对于大模型的训练至关重要。在模型训练之前,通常依赖专业数据团队对数据集进行预处理。这些预处理操作通常包括:去重,即去除重复的文本数据,一般以句子为单位;文本正则化或标准化,如全角字符转半角字符,繁体中文转简体中文等;文本清洗,即剔除超文本标记语言(html)或者表情符号(emoji)等非文本内容,并对标点符号进行过滤和统一;分词,即将句子拆分成单个的词;词的清洗,如去除停用词等;词的正则化或标准化,如统一数字的写法等。经过以上预处理流程,通常可以得到质量相对较高的文本数据,防止数据中的噪声对模型的训练产生不良影响,有助于后续模型的高效训练。
除了上述常规操作之外,在一些特定的处理任务中,数据团队有可能还会根据不同目的对模型训练数据进行过滤。比如,若要构建一个金融领域的知识系统,那么最好把大模型训练数据中与金融领域相关的数据筛选出来,这样可以提升模型生成的文本与金融领域的匹配程度,使模型的输出看起来“更专业”。
合成数据能高效且合规地解决前面的痛点,并且保护隐私
当前,大模型的训练严重依赖现有的互联网公开文本数据。如果下一代大模型的参数达到万亿级别以上的话,数据短缺的问题将成为训练瓶颈。对此,合成数据将是一种有效的解决方案。
合成数据是计算机模拟技术或算法创建生成的自标注信息,能够在数学上或统计学上反映原始数据的属性,因此可以作为原始数据的替代品来训练、测试、验证大模型。合成数据可分为三类:表格数据和结构化数据;图像、视频、语音等媒体数据;文本数据。在大模型的训练开发上,合成数据相比原始数据,可以发挥同样甚至更好的作用,实现更廉价、更高效的大模型训练、测试和验证数据供给。ChatGPT类面向终端用户的应用只是大模型落地的开始,而产业互联网领域的应用空间更为广阔,合成数据可以解决ChatGPT类大模型的潜在数据瓶颈,推动科研和产业的进一步发展。
合成数据可以精确地复制原始数据集的统计特征,但又与原始数据不存在任何关联,所以实际应用过程中的效果强于传统的脱敏数据,便于在更大范围内分享和使用。合成数据创造的新样本具有原始数据的性质,甚至可以通过深度学习算法合成原始数据中没有的罕见样本。合成数据的产业价值主要体现在以下几个方面:实现数据增强和数据模拟,解决数据匮乏、数据质量等问题;有效解决数据隐私保护和数据安全问题,这对于金融、医疗等领域尤为重要;确保数据多样性,纠正历史数据中的偏见,消除算法歧视;应对罕见案例,创建现实中难以采集的数据场景,确保大模型输出结果的准确性。
2024年大模型训练数据中将有60%都是合成数据,2030年绝大多数都是
全球IT研究与咨询机构Gartner预测,到2024年用于训练大模型的数据中有60%将是合成数据,到2030年大模型使用的绝大部分数据将由人工智能合成。《麻省理工科技评论》(MIT Technology Review)将大模型合成数据列为2022年十大突破性技术之一,称其有望解决人工智能领域的“数据鸿沟”问题。可以预见,合成数据作为数据要素市场的新增量,在具备产业价值的同时,也可以解决人工智能和数字经济的数据供给问题。
汉仪股份:公司字库软件授权业务的客户包括腾讯、淘宝、京东、百度、华为、美的、可口可乐、大众汽车、金山办公、阅文集团等众多国内外知名企业。
字库是外文字体、中文字体以及相关字符的电子文字字体集合库,被广泛用于计算机、网络及相关电子产品上。
文字依然是CHATGPT类应用重要的呈现方式
作为国内字库行业领先企业,汉仪股份的字库在文心一言中得到应用。
汉仪股份
汉仪股份:您好!公司利用AI技术探索提升字体等内容素材的创造效率,在“合成数据”方面有自己的积累。在人工智能辅助字体设计上,我们的技术可以利用机器学习算法分析并学习数千款字体数据,从而帮助设计师快速生成新的设计作品,大幅提升生产效率和产品质量。在图像素材生成领域,公司积极探索以设计为主导的文图生成范式,致力于解决创意到可控优质素材的快速生成,从而缩短设计周期、降低成本。
综上所述,汉仪股份是一个低位小盘具有极大预期差的GPT4分支题材里面7亿流通市值超小盘股!很多老师之前买不了科创板,趁着周末特意给老师们找到一个创业板的预期差低位放量小票,老师们放心搞!
汉仪股份:GPT4微软AI办公套件+华为ERP+MLOps概念,三大大核心题材全部都有!巨大预期差!
K线上看汉仪股份已经一个放量长阳线穿过所有均线,呈现多头排列,回踩之后就是绝佳买点!即将迎来新的主升浪!这波风口高度先看新高58元!就这样!
最后是汉仪股份近期部分研报给老师们参考!
文心一言与GPT-4有望在下周发布,多模态融合或将是大模型主流趋势之一。3月1日,微软推出了多模态大模型Kosmos-1,可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等。3月6日,谷歌提出了一个具身多模态语言模型PaLM-E,能将视觉和语言集成到机器人控制中。PaLM-E最终的参数量高达5620亿,这是全球已知的最大视觉语言模型,可以在不需要再训练的情况下执行各种任务。3月9日,微软德国CTOAndreasBraun表示,GPT-4将在下周发布,将提供多模态模型。与此同时,国内也在加速AIGC相关大模型研发。百度于3月16日14时在北京总部召开新闻发布会,主题围绕文心一言。大模型的多模态融合或将是未来技术更新迭代的主流趋势之一,以实现更多场景的应用。在AIGC和ChatGPT方面,我们建议持续关注技术发展和应用情况,把握技术催化和商业化落地带来的投资机会:1)具备AIGC和ChatGPT的技术探索和应用的公司:百度集团-SW、商汤-W、万兴科技、拓尔思等;2)具有海量内容素材且具有AIGC探索布局的,图片/文字/音乐/视频内容及平台公司腾讯控股,阅文集团、美图公司、视觉中国、中文在线、汉仪股份、昆仑万维、汤姆猫、风语筑等。
《东财传媒互联网》独家覆盖AIGC核心标的——汉仪股份