人工智能基础经验 - 技术经验

文心一言 VS 讯飞星火 VS chatgpt （175）-- 算法导论13.3 4题

四、用go语言，Teach 教授担心 RB-INSERT-FIXUP可能将 T.nil.color 设为 RED，这时，当 z 为根时第1行的测试就不会让循环终止。通过讨论 RB-INSERT-FIXUP永远不会将 T.nil.color 设置为 RED，来说明这位教授的担心是没有必要的。文心一...[2024/1/10]

基于“小数据”的机器学习

机器学习作为人工智能的一种最重要的实现方式，其历史可以追溯到20世纪50年代。只不过，早期受制于计算机的算力，基本没有什么能够落地的实际应用，更多的是各类算法的研究和发展。之后，随着硬件的飞速发展，终于迎来了人工智能的春天，各种机器学习的算法在我们的日常生活中得到了广泛应用（很多情况甚至我...[2024/1/10]

【scikit-learn基础】--『监督学习』之贝叶斯分类

贝叶斯分类是一种统计学分类方法，基于贝叶斯定理，对给定的数据集进行分类。它的历史可以追溯到18世纪，当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理，这个定理为统计决策提供了理论基础。不过，贝叶斯分类在实际应用中的广泛使用是在20世纪80年代，当时计算机技术的进步使得大规模数据处理成为可能。...[2024/1/8]

ChatGPT 沦为了我的打工仔

大家好，我是老章最近在折腾之前搞的R-bookdown网站、Jekyll博客，还有刚上了Astro做的周刊、Astro Starlight做的文档站 R2ML：https: r2ml.zhanglearning.com/ 博客：https: blog.zhanglearning.com/ ...[2024/1/8]

f-VAEGAN-D2：VAE+GAN处理零样本学习问题 - zh-jp

虽然f-VAEGAN-D2在题目中说“适用任意样本”，但对比的Few-shot相关的实验较少，这里仅讨论零样本学习的情况。 1. 背景介绍由于为每个对象收集足够数量的高质量带标签样本难以实现，使用有限的标签进行训练学习一直是一个重要的研究方向。零样本学习（Zero-Shot Learni...[2024/1/8]

掌握语义内核(Semantic Kernel)：如何精进你的提示词工程

在人工智能的海洋里，大型语言模型（LLM AI）是高速发展的一艘巨轮，而有效地与其沟通和指导其行为的锚，正是提示语（prompts）。提示语是我们提供给模型的输入或查询，以期获取特定的响应。当今，提示语工程（prompt engineeri...[2024/1/8]

Huggy Lingo: 利用机器学习改进 Hugging Face Hub 上的语言元数据

太长不看版: Hub 上有不少数据集没有语言元数据，我们用机器学习来检测其语言，并使用 librarian-bots 自动向这些数据集提 PR 以添加其语言元数据。 Hugging Face Hub 已成为社区共享机器学习模型、数据集以及应用的存储库。随着 Hub 上的数据集越来越多，元数据，...[2024/1/5]

《A Novel Table-to-Graph Generation Approach for Document-Level Joint Entity and Relation Extraction》阅读笔记

代码原文地址文档级关系抽取（DocRE）的目的是从文档中提取实体之间的关系，这对于知识图谱构建等应用非常重要。然而，现有的方法通常需要预先识别出文档中的实体及其提及，这与实际应用场景不一致。为了解决这个问题，本文提出了一种新颖的表格到图生成模型（TAG），它能够...[2024/1/3]

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费大家好，我是老章推荐几个质量上乘且完全免费的微软开源课程面向初学者的机器学习课程地址：https: microsoft.github.io/ML-For-Beginner #/ 学习经典机器学习，主要使用...[2024/1/3]

【scikit-learn基础】--『监督学习』之决策树回归

决策树算法是一种既可以用于分类，也可以用于回归的算法。决策树回归是通过对输入特征的不断划分来建立一棵决策树，每一步划分都基于当前数据集的最优划分特征。它的目标是最小化总体误差或最大化预测精度，其构建通常采用自上而下的贪心搜索方式，通过比较不同划分标准来选择最优划分。决策树回归广泛应用于...[2024/1/2]

基于QT环境下，实现客户端红外采集人体向服务端通信。

一、本次测试目的　　基于QT环境下STM32人体红外检测，实现客户端红外采集到信息向服务端通信。二、功能　　(1)、传入音乐，当服务端接收到信息时，打开音乐　 (2)、在服务端上面显示图片，当接收到打开或者关闭信息时，切换图片三、代码展示 &nbs...[2023/12/29]

（数据科学学习手札156）地图可视化神器kepler.gl 3.0版本发布

本文已收录至我的Github仓库https: github.com/CNFeffery/DataScienceStudyNotes 1 简介　　大家好我是费老师，地图可视化神器kepler.gl终于带来了其3.0大版本的更新??，距离其上一个正式版本2.5.5的发布已经过去了两年多的时间...[2023/12/29]

免费背景音人声分离解决方案MVSEP-MDX23,足以和Spleeter分庭抗礼

在音视频领域，把已经发布的混音歌曲或者音频文件逆向分离一直是世界性的课题。音波混合的物理特性导致在没有原始工程文件的情况下，将其还原和分离是一件很有难度的事情。言及背景音人声分离技术，就不能不提Spleeter，它是一种用于音频源分离（音乐分离）的开源深度学习算法，由Deezer研究团队...[2023/12/29]

韩国国民搜索 NAVER：为 AI 平台引入存储方案 JuiceFS

NAVER 是一家多元化的互联网公司，拥有韩国最大的搜索引擎并在人工智能、自动驾驶等高科技领域积极投入。在搭建 AI 平台时，NAVER 评估了公有云平台的存储产品、Alluxio 以及高性能专用存储产品等多种选项后，最终决定采用 JuiceFS。通过使用JuiceFS，NAVER 成功地...[2023/12/27]

人脸识别技术演进：从几何算法到深度学习的深度剖析

本文全面探讨了人脸识别技术的发展历程、关键方法及其应用任务目标，深入分析了从几何特征到深度学习的技术演进。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师，项目管理专...[2023/12/27]

Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)

对于深度学习初学者来说，JupyterNoteBook的脚本运行形式显然更加友好，依托Python语言的跨平台特性，JupyterNoteBook既可以在本地线下环境运行，也可以在线上服务器上运行。GoogleColab作为免费GPU算力平台的执牛耳者，更是让JupyterNoteBook的...[2023/12/27]

神经网络优化篇：详解其他正则化方法（Other regularization methods）

其他正则化方法除了\(L2\)正则化和随机失活（dropout）正则化，还有几种方法可以减少神经网络中的过拟合: 一.数据扩增假设正在拟合猫咪图片分类器，如果想通过扩增训练数据来解决过拟合，但扩增数据代价高，而且有时候无法扩增数据，但可以通过添加这类图片来增加训练集。例如，水平翻转图...[2023/12/27]

神经网络优化篇：如何理解 dropout（Understanding Dropout）

理解 dropout Dropout可以随机删除网络中的神经单元，为什么可以通过正则化发挥如此大的作用呢？直观上理解：不要依赖于任何一个特征，因为该单元的输入可能随时被清除，因此该单元通过这种方式传播下去，并为单元的四个输入增加一点权重，通过传播所有权重，dropout将产生收缩权重的平方范...[2023/12/26]

生成式AI：未来的发展方向是什么？

生成式AI的问世标志着人工智能领域迎来了一个全新时代的开启。今年，ChatGPT的面世引起了广泛的热议和关注，许多人认为这标志着人工智能领域进入了一个大规模探索的时代。然而，事实上，这只是生成式AI发展的第一波浪潮，第二波浪潮已经悄然兴起，即整合时代。在这个时代，不同的生成式AI系统和企业正在积...[2023/12/22]

经典卷积神经网络LeNet&AlexNet&VGG

LeNet LeNet-5是一种经典的卷积神经网络结构，于1998年投入实际使用中。该网络最早应用于手写体字符识别应用中。普遍认为，卷积神经网络的出现开始于LeCun等提出的LeNet网络，可以说LeCun等是CNN的缔造者，而LeNet则是LeCun等创造的CNN经典之作网络结构图由下图所示...[2023/12/21]

大语言模型训练数据常见的4种处理方法

本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》，作者：码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还没有非常好的大模型的理论分析和解释，也缺...[2023/12/21]

87 GB 模型种子，GPT-4 缩小版，超越ChatGPT3.5，多平台在线体验

瞬间爆火的Mixtral 8x7B 大家好，我是老章最近风头最盛的大模型当属Mistral AI 发布的Mixtral 8x7B了，火爆程度压过Google的Gemini。缘起是MistralAI二话不说，直接在其推特账号上甩出了一个87GB的种子随后Mixtral公布了模型...[2023/12/18]

训练一个目标检测模型

博客地址：https: www.cnblogs.com/zylyehuo/ （一）识别背景/目的第十八届全国大学生智能汽车竞赛室外 ROS 无人车赛（高教组）无人车在室外运行中，需要探索未知环境，识别障碍物，停车标志牌、红绿灯等标志物。比赛场地为不规则环形场地， ...[2023/12/15]

LLM面面观之LLM复读机问题及解决方案

1. 背景关于LLM复读机问题，本qiang~在网上搜刮了好几天，结果是大多数客观整理的都有些支离破碎，不够系统。因此，本qiang~打算做一个相对系统的整理，包括LLM复读机产生的原因以及对应的解决方案。 2. LLM复读机示例示例1：短语级别的重复 User: 你喜欢北京...[2023/12/15]

重磅：谷歌发布最强大AI模型【Google Gemini】

一、前言北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型，并且提供了 API 访问。一个更好的消息是：Gemini Pro 可免费使用。赶紧体验起来吧~ 二、关于 Google Gemini是一款由Google AI开发的大型语言模型聊天机器人。...[2023/12/15]

AI浪潮下，大模型如何在音视频领域运用与实践？

视频云大模型算法「方法论」。刘国栋｜演讲者在AI技术发展如火如荼的当下，大模型的运用与实践在各行各业以千姿百态的形式展开。音视频技术在多场景、多行业的应用中，对于智能化和效果性能的体验优化有较为极致的要求。如何运用好人工智能提升算法能力，解决多场景业务中的具体问题，需要创新地探索大模型技术...[2023/12/15]

文心一言 VS 讯飞星火 VS chatgpt （153）-- 算法导论12.2 9题

九、用go语言，设 T 是一棵二叉搜索树，其关键字互不相同;设 x 是一个叶结点，y 为其父结点。证明： y.key 或者是 T 树中大于 x.key 的最小关键字，或者是 T 树中小于 x.key 的最大关键字。文心一言：要证明这个性质，我们可以采用二叉搜索树的性质：对于任何节点N，其左子...[2023/12/11]

生成模型的两大代表：VAE和GAN - zh-jp

生成模型给定数据集，希望生成模型产生与训练集同分布的新样本。对于训练数据服从\(p_{data}(x)\)；对于产生样本服从\(p_{model}(x)\)。希望学到一个模型\(p_{model}(x)\)与\(p_{data}(x)\)尽可能接近。这也是无监督学习中的一个核心问题——密度...[2023/12/11]

机器学习 - 决策树：技术全解与案例实战

本文深入探讨了机器学习中的决策树算法，从基础概念到高级研究进展，再到实战案例应用，全面解析了决策树的理论及其在现实世界问题中的实际效能。通过技术细节和案例实践，揭示了决策树在提供可解释预测中的独特价值。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研...[2023/12/11]

手把手教你搭建 Ceph＋JuiceFS

Ceph 提供了对象存储，可作为存储引擎在 JuiceFS 中使用。这一组合非常适合云计算、大数据分析和机器学习等数据密集型应用场景。在日常部署中可直接通过 Ceph RADOS 配合 JuiceFS 使用，无需部署 RGW。基于此方案实践以及运维中的常见问题，结合Ceph 官方文档整理了这...[2023/12/8]

语言模型：GPT与HuggingFace的应用

本文分享自华为云社区《大语言模型底层原理你都知道吗？大语言模型底层架构之二GPT实现》，作者：码上开花_Lancer 。受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型微调的范式影响，自然语言处理领域基于预训...[2023/12/8]

向“创新者”升阶，程序员当下如何应对 AI 的挑战

随着 AI 技术的飞速发展，特别是大模型的出现，传统的程序员角色正在经历深刻的变革，我们不得不重新对自己进行审视和思考。通用领域大模型的“泛化能力” 在过去的二十年内，AI 领域的大部分研究和应用都集中在完成一项特定的任务中，例如：分类图片、总结文章、多语言翻译等，然而随着模型参数的增加， ...[2023/12/5]

机器学习-学习率：从理论到实战，探索学习率的调整策略

本文全面深入地探讨了机器学习和深度学习中的学习率概念，以及其在模型训练和优化中的关键作用。文章从学习率的基础理论出发，详细介绍了多种高级调整策略，并通过Python和PyTorch代码示例提供了实战经验。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品...[2023/12/5]

解锁机器学习-梯度下降：从技术到实战的全面指南

本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例，本文旨在为读者提供一种直观且实用的视角，以理解这些优化算法的工作原理和应用场景。关注TechLead，分享AI全维度知识。作者拥有10+年互联网...[2023/12/1]

拥抱未来：大语言模型解锁平台工程的无限可能

了解大型语言模型 (LLM) 大型语言模型（LLM）是一种人工智能（AI）算法，它使用深度学习技术和海量数据集来理解、总结、生成和预测新内容。凭借合成大量信息的能力，LLM 可以提高以前需要人类专家的业务流程的效率、规模和一致性。沃顿商学院商学教授 Ethan Mollick...[2023/12/1]

神经网络入门篇：详解核对矩阵的维数（Getting your matrix dimensions right）

核对矩阵的维数当实现深度神经网络的时候，其中一个常用的检查代码是否有错的方法就是拿出一张纸过一遍算法中矩阵的维数。 \(w\)的维度是（下一层的维数，前一层的维数），即\({{w}^{[l]}}\): (\({{n}^{[l]}}\),\({{n}^{[l-1]}}\))； \(b\)的维...[2023/12/1]

可视化学习：利用向量计算点到线段的距离并展示

本文可配合本人录制的视频一起食用。引言最近我在学可视化的东西，借此来巩固一下学习的内容，向量运算是计算机图形学的基础，这个例子就是向量的一种应用，是利用向量来计算点到线段的距离，这个例子中可视化的展示采用Canvas2D来实现。说起向量，当时一看到这个词，我是一种很模糊的记忆；这些是中...[2023/11/22]

本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)

按照固有思维方式，深度学习的训练环节应该在云端，毕竟本地硬件条件有限。但事实上，在语音识别和自然语言处理层面，即使相对较少的数据量也可以训练出高性能的模型，对于预算有限的同学们来说，也没必要花冤枉钱上“云端”了，本次我们来演示如何在本地训练Bert-VITS2 V2.0.2模型。 Bert-...[2023/11/22]

文心一言 VS 讯飞星火 VS chatgpt （138）-- 算法导论11.4 2题

二、用go语言，试写出HASH-DELETE 的伪代码;修改 HASH-INSERT，使之能处理特殊值DELETED。文心一言：首先，让我们定义一个基本的哈希表数据结构。这个结构将包括一个存储键值对的哈希表和一个存储已删除键值对的队列。我们可以用空值和大括号 {} 来表示“DELETED”。...[2023/11/20]

使用GPT4进行数据分析，竟然被他骗了

上周，OpenAI开发者大会上OpenAI发布了一系列震撼人心的功能。而最让我感兴趣的，就是GPT4的数据分析功能了。话不多说，赶紧上号体验一下。在最新登录GPT4的时候，都会有下面这个提示，目前已经支持联网，分析数据，生成图片的功能了。这是plus用户都可以使用的。然后我们可以在上...[2023/11/15]

斗地主AI出牌助手--在线调用斗地主AI，实现自动斗地主

简介程序基于Python3.7开发的斗地主AI出牌助手，目前支持欢乐斗地主桌面版，微信版，也可以自己制作相应其他版本。此出牌助手核心是识别出三位玩家出牌内容，调用基于DouZero封装的API接口，输入出牌内容，根据AI出牌方案，打出相应的牌。运行效果 ![](https: img20...[2023/11/15]

个人编程助手: 训练你自己的编码助手

在编程和软件开发这个不断演变的领域中，对效率和生产力的追求催生了许多卓越的创新。其中一个显著的创新就是代码生成模型的出现，如 Codex、StarCoder 和 Code Llama。这些模型在生成类似人类编写的代码片段方面表现出惊人能力，显示出了作为编程助手的巨大潜力。然而，虽然这些预训练...[2023/11/15]

GCD Inside: GCD 数据结构

1 OS_object OS_object由下面宏OS_OBJECT_DEC_BASE扩展而来: 1. o object.h OS_OBJECT_DECL_BASE(object, NSObject); 2. o object.h #define OS_OBJECT_DECL_BAS...[2023/11/13]

深入探索智能问答：从检索到生成的技术之旅

在本文中，我们深入探讨了自然语言处理中的智能问答系统，从其发展历程、主要类型到不同的技术实现。文章详细解析了从基于检索、对话到基于生成的问答系统，展示了其工作原理和具体实现。通过对技术和应用的深度剖析，旨在帮助读者对这一令人兴奋的领域有更全面的认识。关注TechLead，分享AI全维度...[2023/11/10]

神经网络入门篇：详解计算一个神经网络的输出（Computing a Neural Network's output）

一个神经网络的输出首先，回顾下只有一个隐藏层的简单两层神经网络结构：图1.3.1 其中，\(x\)表示输入特征，\(a\)表示每个神经元的输出，\(W\)表示特征的权重，上标表示神经网络的层数（隐藏层为1），下标表示该层的第几个神经元。这是神经网络的符号惯例，下同。神经网络的计算...[2023/11/10]

基于开源模型搭建实时人脸识别系统（五）：人脸跟踪

继续填坑，之前已经讲了人脸检测，人脸检测是定位出画面中人脸的位置，理论上把检测到的人脸进行提特征就能做人脸识别了，不过直接这样做是有缺陷，一是存在很大的资源浪费，毕竟同一个人出现在画面，我们实际上应该只需要做一次识别就知道他的身份（理想情况下），而不需要每一帧都去做；二是如果对每一帧都进行独立的...[2023/11/3]

games101-1 光栅化与光线追踪中的空间变换

在学习了一些games101的课程之后，我还是有点困惑，对于计算机图形学的基础知识，总感觉还是缺乏一些更加全面的认识，幸而最*在做games101的第五次作业时，查询资料找到了scratchpixel这个网站，看了一些文章，终于把脑子里的一团乱麻组织起来了，也就有了这篇关于图形学的第一篇博客。 ...[2023/11/3]

简直不能相信！这款IDE仅插件10秒写出飞机大战游戏，太神奇了！

一、写在前面昨天分享了一款可以帮我们写代码的插件CodeGeex，其实能帮我们解决大部分问题，讲道理已经很好了对不对？ but，他就是最好的插件吗？肯定不是，这不又让我又发现了一款可以平替的插件TONGYI Lingma（阿里云出品智能编码助手通义灵码）。可能有同学会问了，那六哥这两...[2023/11/3]

【scipy 基础】--傅里叶变换

傅里叶变换是一种数学变换，它可以将一个函数或信号转换为另一个函数或信号，它可以将时域信号转换为频域信号，也可以将频域信号转换为时域信号。在很多的领域都有广泛的应用，例如信号处理、通信、图像处理、计算机科学、物理学、生物学等。它最大的功能是能够分析和提取信号的特征，将复杂的信号分解为简单的信...[2023/11/3]

阿里发布AI编码助手：通义灵码，兼容 VS Code、IDEA等主流编程工具

今天是阿里云栖大会的第一天，相信场外的瓜，大家都吃过了。这里就不说了，有兴趣可以看看这里：云栖大会变成相亲现场，最新招婿鄙视链来了... 。这里主要说说阿里还发布了一款AI编码助手，对于我们开发者来说，还是非常值得关注的。根据官网介绍，这款插件支持 VS Code、JetBrains 旗...[2023/11/1]

575