生成式AI:未来的发展方向是什么?
生成式AI的问世标志着人工智能领域迎来了一个全新时代的开启。今年,ChatGPT的面世引起了广泛的热议和关注,许多人认为这标志着人工智能领域进入了一个大规模探索的时代。然而,事实上,这只是生成式AI发展的第一波浪潮,第二波浪潮已经悄然兴起,即整合时代。在这个时代,不同的生成式AI系统和企业正在积...[2023/12/22]
经典卷积神经网络LeNet&AlexNet&VGG
LeNet
LeNet-5是一种经典的卷积神经网络结构,于1998年投入实际使用中。该网络最早应用于手写体字符识别应用中。普遍认为,卷积神经网络的出现开始于LeCun等提出的LeNet网络,可以说LeCun等是CNN的缔造者,而LeNet则是LeCun等创造的CNN经典之作网络结构图由下图所示...[2023/12/21]
大语言模型训练数据常见的4种处理方法大语言模型训练数据常见的4种处理方法
本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》,作者: 码上开花_Lancer。
大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然,截止到2023 年9 月为止,还没有非常好的大模型的理论分析和解释,也缺...[2023/12/21]
87 GB 模型种子,GPT-4 缩小版,超越ChatGPT3.5,多平台在线体验
瞬间爆火的Mixtral 8x7B
大家好,我是老章
最近风头最盛的大模型当属Mistral AI 发布的Mixtral 8x7B了,火爆程度压过Google的Gemini。
缘起是MistralAI二话不说,直接在其推特账号上甩出了一个87GB的种子
随后Mixtral公布了模型...[2023/12/18]
训练一个目标检测模型
博客地址:https: www.cnblogs.com/zylyehuo/
(一)识别背景/目的
第十八届全国大学生智能汽车竞赛室外 ROS 无人车赛(高教组)
无人车在室外运行中, 需要探索未知环境, 识别障碍物, 停车标志牌、红绿灯等标志物。
比赛场地为不规则环形场地, ...[2023/12/15]
LLM面面观之LLM复读机问题及解决方案
1. 背景
关于LLM复读机问题,本qiang~在网上搜刮了好几天,结果是大多数客观整理的都有些支离破碎,不够系统。
因此,本qiang~打算做一个相对系统的整理,包括LLM复读机产生的原因以及对应的解决方案。
2. LLM复读机示例
示例1:短语级别的重复
User: 你喜欢北京...[2023/12/15]
重磅:谷歌发布最强大AI模型【Google Gemini】
一、前言
北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问。
一个更好的消息是:Gemini Pro 可免费使用。赶紧体验起来吧~
二、关于
Google Gemini是一款由Google AI开发的大型语言模型聊天机器人。...[2023/12/15]
AI浪潮下,大模型如何在音视频领域运用与实践?
视频云大模型算法「方法论」。
刘国栋|演讲者
在AI技术发展如火如荼的当下,大模型的运用与实践在各行各业以千姿百态的形式展开。音视频技术在多场景、多行业的应用中,对于智能化和效果性能的体验优化有较为极致的要求。如何运用好人工智能提升算法能力,解决多场景业务中的具体问题,需要创新地探索大模型技术...[2023/12/15]
文心一言 VS 讯飞星火 VS chatgpt (153)-- 算法导论12.2 9题
九、用go语言,设 T 是一棵二叉搜索树,其关键字互不相同;设 x 是一个叶结点,y 为其父结点。证明: y.key 或者是 T 树中大于 x.key 的最小关键字,或者是 T 树中小于 x.key 的最大关键字。
文心一言:
要证明这个性质,我们可以采用二叉搜索树的性质:对于任何节点N,其左子...[2023/12/11]
生成模型的两大代表:VAE和GAN - zh-jp
生成模型
给定数据集,希望生成模型产生与训练集同分布的新样本。对于训练数据服从\(p_{data}(x)\);对于产生样本服从\(p_{model}(x)\)。希望学到一个模型\(p_{model}(x)\)与\(p_{data}(x)\)尽可能接近。
这也是无监督学习中的一个核心问题——密度...[2023/12/11]
使用Flink完成流数据统计
一、统计流程
所有流计算统计的流程都是:
1、接入数据源
2、进行多次数据转换操作(过滤、拆分、聚合计算等)
3、计算结果的存储 其中数据源可以是多个、数据转换的节点处理完数据可以发送到一个和多个下一个节点继续处理数据
Flink程序构建的基本单元是stream和transforma...[2023/12/11]
机器学习 - 决策树:技术全解与案例实战
本文深入探讨了机器学习中的决策树算法,从基础概念到高级研究进展,再到实战案例应用,全面解析了决策树的理论及其在现实世界问题中的实际效能。通过技术细节和案例实践,揭示了决策树在提供可解释预测中的独特价值。
关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研...[2023/12/11]
扫盲Kafka?看这一篇就够了!
kafka的使用场景
为什么要使用 Kafka 消息队列?
解耦、削峰:传统的方式上游发送数据下游需要实时接收,如果上游在某些业务场景:例如上午十点会流量激增至顶峰,那么下游资源可能会扛不住压力。但如果使用消息队列,就可以将消息暂存在消息管道中,下游可以按照自己的速度逐步处理;
可扩展:通过横...[2023/12/8]
虚拟机运行Hadoop | 各种问题解决的心路历程
ps:完成大数据技术实验报告的过程,出项各种稀奇古怪的问题。(知道这叫什么吗?经济基础决定上层建筑,我当时配置可能留下了一堆隐患,总之如果有同样的问题,希望可以帮到你)
一、虚拟机网络连接不通的各种情况
我这里遇到的是,三台虚拟机,两台piing百度不同
原因:改了下内存,重启就又未知的网络名...[2023/12/8]
手把手教你搭建 Ceph+JuiceFS
Ceph 提供了对象存储,可作为存储引擎在 JuiceFS 中使用。这一组合非常适合云计算、大数据分析和机器学习等数据密集型应用场景。
在日常部署中可直接通过 Ceph RADOS 配合 JuiceFS 使用,无需部署 RGW。基于此方案实践以及运维中的常见问题,结合Ceph 官方文档整理了这...[2023/12/8]
语言模型:GPT与HuggingFace的应用
本文分享自华为云社区《大语言模型底层原理你都知道吗?大语言模型底层架构之二GPT实现》,作者:码上开花_Lancer 。
受到计算机视觉领域采用ImageNet对模型进行一次预训练,使得模型可以通过海量图像充分学习如何提取特征,然后再根据任务目标进行模型微调的范式影响,自然语言处理领域基于预训...[2023/12/8]
向“创新者”升阶,程序员当下如何应对 AI 的挑战向“创新者”升阶,程序员当下如何应对 AI 的挑战
随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。
通用领域大模型的“泛化能力”
在过去的二十年内,AI 领域的大部分研究和应用都集中在完成一项特定的任务中,例如:分类图片、总结文章、多语言翻译等,然而随着模型参数的增加, ...[2023/12/5]
机器学习-学习率:从理论到实战,探索学习率的调整策略
本文全面深入地探讨了机器学习和深度学习中的学习率概念,以及其在模型训练和优化中的关键作用。文章从学习率的基础理论出发,详细介绍了多种高级调整策略,并通过Python和PyTorch代码示例提供了实战经验。
关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品...[2023/12/5]
解锁机器学习-梯度下降:从技术到实战的全面指南
本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例,本文旨在为读者提供一种直观且实用的视角,以理解这些优化算法的工作原理和应用场景。
关注TechLead,分享AI全维度知识。作者拥有10+年互联网...[2023/12/1]
拥抱未来:大语言模型解锁平台工程的无限可能
了解大型语言模型 (LLM)
大型语言模型(LLM)是一种人工智能(AI)算法,它使用深度学习技术和海量数据集来理解、总结、生成和预测新内容。凭借合成大量信息的能力,LLM 可以提高以前需要人类专家的业务流程的效率、规模和一致性。
沃顿商学院商学教授 Ethan Mollick...[2023/12/1]
神经网络入门篇:详解核对矩阵的维数(Getting your matrix dimensions right)
核对矩阵的维数
当实现深度神经网络的时候,其中一个常用的检查代码是否有错的方法就是拿出一张纸过一遍算法中矩阵的维数。
\(w\)的维度是(下一层的维数,前一层的维数),即\({{w}^{[l]}}\): (\({{n}^{[l]}}\),\({{n}^{[l-1]}}\));
\(b\)的维...[2023/12/1]
Kafka 如何保证消息消费的全局顺序性Kafka 如何保证消息消费的全局顺序性
哈喽大家好,我是咸鱼
今天我们继续来讲一讲 Kafka
当有消息被生产出来的时候,如果没有指定分区或者指定 key ,那么消费会按照【轮询】的方式均匀地分配到所有可用分区中,但不一定按照分区顺序来分配
我们知道,在 Kafka 中消费者可以订阅一个或多个主题,并被分配一个或多个分区
...[2023/11/29]
可视化学习:利用向量计算点到线段的距离并展示可视化学习:利用向量计算点到线段的距离并展示
本文可配合本人录制的视频一起食用。
引言
最近我在学可视化的东西,借此来巩固一下学习的内容,向量运算是计算机图形学的基础,这个例子就是向量的一种应用,是利用向量来计算点到线段的距离,这个例子中可视化的展示采用Canvas2D来实现。
说起向量,当时一看到这个词,我是一种很模糊的记忆;这些是中...[2023/11/22]
本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)
按照固有思维方式,深度学习的训练环节应该在云端,毕竟本地硬件条件有限。但事实上,在语音识别和自然语言处理层面,即使相对较少的数据量也可以训练出高性能的模型,对于预算有限的同学们来说,也没必要花冤枉钱上“云端”了,本次我们来演示如何在本地训练Bert-VITS2 V2.0.2模型。
Bert-...[2023/11/22]
文心一言 VS 讯飞星火 VS chatgpt (138)-- 算法导论11.4 2题
二、用go语言,试写出HASH-DELETE 的伪代码;修改 HASH-INSERT,使之能处理特殊值DELETED。
文心一言:
首先,让我们定义一个基本的哈希表数据结构。这个结构将包括一个存储键值对的哈希表和一个存储已删除键值对的队列。我们可以用空值和大括号 {} 来表示“DELETED”。...[2023/11/20]
Kafka 集群如何实现数据同步?Kafka 集群如何实现数据同步?
哈喽大家好,我是咸鱼
最近这段时间比较忙,将近一周没更新文章,再不更新我那为数不多的粉丝量就要库库往下掉了 T﹏T
刚好最近在学 Kafka,于是决定写篇跟 Kafka 相关的文章(文中有不对的地方欢迎大家指出)
考虑到有些小伙伴可能是第一次接触 Kafka ,所以先简单介绍一下什么是 K...[2023/11/17]
使用GPT4进行数据分析,竟然被他骗了
上周,OpenAI开发者大会上OpenAI发布了一系列震撼人心的功能。而最让我感兴趣的,就是GPT4的数据分析功能了。话不多说,赶紧上号体验一下。
在最新登录GPT4的时候,都会有下面这个提示,目前已经支持联网,分析数据,生成图片的功能了。这是plus用户都可以使用的。
然后我们可以在上...[2023/11/15]
斗地主AI出牌助手--在线调用斗地主AI,实现自动斗地主
简介
程序基于Python3.7开发的斗地主AI出牌助手,目前支持欢乐斗地主桌面版,微信版,也可以自己制作相应其他版本。
此出牌助手核心是识别出三位玩家出牌内容,调用基于DouZero封装的API接口,输入出牌内容,根据AI出牌方案,打出相应的牌。
运行效果
;
2. o object.h
#define OS_OBJECT_DECL_BAS...[2023/11/13]
深入探索智能问答:从检索到生成的技术之旅
在本文中,我们深入探讨了自然语言处理中的智能问答系统,从其发展历程、主要类型到不同的技术实现。文章详细解析了从基于检索、对话到基于生成的问答系统,展示了其工作原理和具体实现。通过对技术和应用的深度剖析,旨在帮助读者对这一令人兴奋的领域有更全面的认识。
关注TechLead,分享AI全维度...[2023/11/10]
神经网络入门篇:详解计算一个神经网络的输出(Computing a Neural Network's output)神经网络入门篇:详解计算一个神经网络的输出(Computing a Neural Network's output)
一个神经网络的输出
首先,回顾下只有一个隐藏层的简单两层神经网络结构:
图1.3.1
其中,\(x\)表示输入特征,\(a\)表示每个神经元的输出,\(W\)表示特征的权重,上标表示神经网络的层数(隐藏层为1),下标表示该层的第几个神经元。这是神经网络的符号惯例,下同。
神经网络的计算...[2023/11/10]
每天5分钟复习OpenStack(九)存储发展史
上一章节我们介绍了使用本地硬盘做kvm的存储池,这章开始将介绍下存储的发展历程,并介绍什么是分布式存储,为什么HDFS为有中心节点的分布式存储?
1、存储发展
在单机计算时代(大型机、小型机、微机),内部存储器可以理解为内存(即Memory),外部存储器可以理解为物理硬盘(包括本地硬盘...[2023/11/10]
基于开源模型搭建实时人脸识别系统(五):人脸跟踪
继续填坑,之前已经讲了人脸检测,人脸检测是定位出画面中人脸的位置,理论上把检测到的人脸进行提特征就能做人脸识别了,不过直接这样做是有缺陷,一是存在很大的资源浪费,毕竟同一个人出现在画面,我们实际上应该只需要做一次识别就知道他的身份(理想情况下),而不需要每一帧都去做;二是如果对每一帧都进行独立的...[2023/11/3]
games101-1 光栅化与光线追踪中的空间变换
在学习了一些games101的课程之后,我还是有点困惑,对于计算机图形学的基础知识,总感觉还是缺乏一些更加全面的认识,幸而最*在做games101的第五次作业时,查询资料找到了scratchpixel这个网站,看了一些文章,终于把脑子里的一团乱麻组织起来了,也就有了这篇关于图形学的第一篇博客。 ...[2023/11/3]
简直不能相信!这款IDE仅插件10秒写出飞机大战游戏,太神奇了!
一、写在前面
昨天分享了一款可以帮我们写代码的插件CodeGeex,其实能帮我们解决大部分问题,讲道理已经很好了对不对?
but,他就是最好的插件吗?
肯定不是,这不又让我又发现了一款可以平替的插件TONGYI Lingma(阿里云出品智能编码助手通义灵码)。
可能有同学会问了,那六哥这两...[2023/11/3]
【scipy 基础】--傅里叶变换
傅里叶变换是一种数学变换,它可以将一个函数或信号转换为另一个函数或信号,它可以将时域信号转换为频域信号,也可以将频域信号转换为时域信号。 在很多的领域都有广泛的应用,例如信号处理、通信、图像处理、计算机科学、物理学、生物学等。
它最大的功能是能够分析和提取信号的特征,将复杂的信号分解为简单的信...[2023/11/3]
阿里发布AI编码助手:通义灵码,兼容 VS Code、IDEA等主流编程工具
今天是阿里云栖大会的第一天,相信场外的瓜,大家都吃过了。这里就不说了,有兴趣可以看看这里:云栖大会变成相亲现场,最新招婿鄙视链来了... 。
这里主要说说阿里还发布了一款AI编码助手,对于我们开发者来说,还是非常值得关注的。
根据官网介绍,这款插件支持 VS Code、JetBrains 旗...[2023/11/1]
一分钟了解 ChatGPT 语音对话一分钟了解 ChatGPT 语音对话
一、背景
近期 ChatGPT 推出新的语音和图像功能,可以与用户进行语音对话或基于用户上传的图像进行分析和对话,提供了一种新的、更直观的交互体验。用户可以更轻松地表达自己的需求、提出问题,并获得 ChatGPT 的回答和建议。而且,语音合成的真实度让用户感觉像是在与真实的对话伙伴进行交流,提供...[2023/10/25]
如何使用DALL-E 3
如何使用 DALL-E 3:OpenAI 图像生成指南
DALL-E 3 是 OpenAI 图像生成器的高级版本,它可以理解自然语言提示来创建详细图像。 它克服了以前版本的方形图像限制,现在支持各种宽高比。 一个显着的特点是它能够从描述中生成艺术,将简单的语言转化为视觉艺术。
它与 Chat ...[2023/10/25]
Lora升级!ReLoRa!最新论文 High-Rank Training Through Low-Rank UpdatesLora升级!ReLoRa!最新论文 High-Rank Training Through Low-Rank Updates
关注公众号TechLead,分享AI与云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。
摘要
尽管通过扩展导致具有数千亿参数的大型网络在...[2023/10/25]
LLM在text2sql上的应用
一、前言:
目前,大模型的一个热门应用方向text2sql它可以帮助用户快速生成想要查询的SQL语句。那对于用户来说,大部分简单的sql都是正确的,但对于一些复杂逻辑来说,需要用户在产出SQL的基础上进行简单修改,Text2SQL应用主要还是帮助用户去解决开发时间,减少开发成本。
Text t...[2023/10/25]
安信可开发环境构建-基于Ai-WB2系列 和 Ai-M61 或 Ai-M62 (环境上下文切换)
首先,对于Ai-WB2系列环境的构建官方文档已经讲的非常明白了,这里不做阐述 如下链接所示https: blog.csdn.net/Boantong_/article/detail 128480919 本人亲自测试可行,请严格follow官方的steps。 另外需要注意的是,为了避免错误...[2023/10/25]
大语言模型基础-Transformer模型详解和训练
一、Transformer概述
Transformer是由谷歌在17年提出并应用于神经机器翻译的seq2seq模型,其结构完全通过自注意力机制完成对源语言序列和目标语言序列的全局依赖建模。
Transformer由编码器和解码器构成。图2.1展示了该结构,其左侧和右侧分别对应着编码器(Enco...[2023/10/25]
基于LangChain的LLM应用开发3——记忆
此情可待成追忆,只是当时已惘然。我们人类会有很多或美好或痛苦的回忆,有的回忆会渐渐模糊,有的回忆午夜梦醒,会浮上心头。
然而现在的大语言模型都是没有记忆的,都是无状态的,大语言模型自身不会记住和你对话之间的历史消息。根本用不着“时时勤拂拭”,天然就是“本来无一物”。每一次的请求交互、api调用...[2023/10/23]
关于AI时代的程序架构的变化
以ChatGPT为代表的AI出现,表示着AI的零点时刻已经突破。现在AI的使用已经不用再多说了,实际上是已经侵入到各行各业。所有人都在疯狂寻找本行业AI的使用场景,这样的盛景只在互联网刚出现的时候能感受到。
马化腾说,这个AI有可能像电一样是重要的未来的基础元素。我感觉还是很有可能。原来波士顿...[2023/10/23]
两台实体机器4个虚拟机节点的Hadoop集群搭建(Ubuntu版)
安装Ubuntu
Linux元信息
两台机器,每台机器两台Ubuntu
Ubuntu版本:ubuntu-22.04.3-desktop-amd64.iso
处理器数量2,每个处理器的核心数量2,总处理器核心数量4
单个虚拟机内存8192MB(8G),最大磁盘大小30G
参考链接
清华大学...[2023/10/23]
从一次Kafka宕机说起(JVM hang)
一、背景
时间大概是在夏天7月份,突然收到小伙伴的情报,我们线上的一个kafka实例的某个broker突然不提供服务了,也没看到什么异常日志,反正就是生产、消费都停了。因为是线上服务,而且进程还在,就是不提供服务了,第一反应就是保留一下 stack 信息,先重启吧
因为这个现象是第一次出现,...[2023/10/19]
【论文阅读】点云地图动态障碍物去除基准 A Dynamic Points Removal Benchmark in Point Cloud Maps
【论文阅读】点云地图动态障碍物去除基准 A Dynamic Points Removal Benchmark in Point Cloud Maps
终于一次轮到了讲自己的paper了 hahaha,写个中文的解读放在博客方便大家讨论
Title Picture
Refere...[2023/10/19]
Kraft模式下Kafka脚本的使用
Kafka集群 版本:V3.5.1
名称
Node1
Node2
Node3
IP
172.29.145.157
172.29.145.182
172.29.145.183
(1)查看Kraft集群中的状态以及Leader节点,投票节点
使用--status可以查看集群...[2023/10/19]