我一直在和一个朋友争论“特征提取”。他说,ML的主要任务是提取特征。但我不同意。一般来说,特征提取不是一项ML任务。如果我们认为wx b是表示ML的最简单的方法,那么ML的任务就是找到最好的w和b。x是特征。ML试图找出给定x的最佳w和b值,它与训练数据匹配,从而学习如何找到w和b。 我的朋友说提取特征是ML的核心任务。但据我所知,特征提取主要是一项数据预处理任务。
在Microsoft Azure机器学习下创建计算实例并选择Jupyter以打开Jupyter笔记本后,我将从菜单中选择新建终端。然而,我得到以下错误: 我已经重新创建了compute实例,但运气不佳。 你知道这个问题与什么有关吗? 谢谢
四年前,我发布了这个问题,得到了一些答案,不幸的是,超出了我的技能水平。我刚刚参加了一个build tour会议,他们在会上谈到了机器学习,这让我想到了使用ML来解决我的问题的可能性。我在azure站点上发现了这一点,但我认为它对我没有帮助,因为它的范围非常狭窄。 以下是我正在努力实现的目标: 我有一个源图像: ML是解决这个问题的好工具吗?如果是的话,有什么开始的建议吗?
[toc] 百度 机器学习算法工程师 凉经 投递 2022.07.25 牛客投递,后面牛客上内推了,发了一个内推确认链接,就等于是官网内推投递吧应该 一面通知 2022.07.29 通知面试,直接发的2022.08.02 晚上 20 : 00一面 一面 2022.08.02 面试时长:60 min 面试平台: 如流(百度自家的) 面试过程,分为3部分 项目 介绍项目,问了两个项目 在问项目过程中,
约的8点开始, 8点面试官进来后说要上卫生间,等到8点10分开始,一共60分钟。 1、开始先聊了会儿在字节实习的内容,主要聊场景; 2、聊完后开始问xgboost(简历有写),很细,都是答完后继续往下深挖,答的不好: 和GBDT的区别 什么场景用lr,什么场景用xgboost,什么场景用nn 构造树的过程 怎么来做多分类的 。。。 3、auc指标的含义 4、分类问题为什么用交叉熵不用mse,从公式
准备工作 1. 准备一张mysql数据库表,至少包含这些列:id、title(文章标题)、content(文章内容)、segment(中文切词)、isTec(技术类)、isSoup(鸡汤类)、isMR(机器学习类)、isMath(数学类)、isNews(新闻类) 2. 根据你关注的微信公众号,把更新的文章的title和content自动写入数据库中,具体方法见《教你成为全栈工程师(Full Sta
全程25分钟 手撕:lc5 只需要输出长度,中心扩展秒了 项目 Transformer中缩放点击注意力为什么要除以根号下dk(这个问题被问到好多次了,给出了原文解释) 为什么值是根号下dk而不是dk,dk的2/3次方等?(这里李沐的动手学深度学习给出了一个解释:假设查询和键的所有元素都是独立的随机变量,并且都满足零均值和单位方差,那么两个向量的点积的均值为0,方差为d。为确保无论向量长度如何,点积
发个面经攒攒人品吧家人们😥 上来全是问基础,太烧脑了呜呜 1.面试官介绍了他们是支付宝广告技术部,主要做搜广推aigc大模型等,包括涉及的业务等 1.开始严刑拷打了呜呜。问我在阿里做aigc项目,主要负责了哪块?问相关的vision transformer有没有了解过?我说没有只看过transformer,然后就问那你说说transformer。。。 2.问了神经网络中最大池化层的反向传播怎么算
笔试时间60min 题型:10单选、8多选、1编程 (选择题有一半是关于相机标定和双目测距的,考的很细节,没接触过,完全不懂。 transform也考了几道题,考的也很细节,有一题给了四篇文献及其概述,让你选正确项,人都蒙了,后来想想四篇文献应该都是transform的经典文章,就是考你有没有读过它们。 语言八股也有一两道题。 其他的题就是关于深度学习的了,不难,毕竟也没几道题。) (编程题是最大
1.transformer结构 2.不用专业知识和数学知识解释CNN 3.如何把图片分割成目标数目不确定的多个子图 4.在UI特别复杂的游戏场景中,如何在数据进入RL之前把游戏场景中的agent信息提取出来 一面过 周四二面
更新:已挂 9月1号投递的算法工程师-机器学习岗,高德部门 9.5一面 (50min) 总结:面试分四部分:简历项目+基础知识+场景题+做题 自我介绍 简历项目比赛介绍+提问 问了许多深度学习和机器学习的基础知识: 卷积 vs 全连接 怎么理解卷积? 图片的物体发生位移或扰动,对CNN有影响吗? 池化的作用 随机森林 vs GBDT 随机森林和GBDT的基分类器可以改成线性分类器或者其他吗? 分类
9.7一面 (约40min) 自我介绍 项目比赛介绍,没有深挖 进程和线程区别 数组和链表的区别 递归和非递归的区别(除了栈这方面) 快排的时间复杂度,快排稳定吗 类似的基础问题等等(想不起来了。。。) 二叉树了解吗?还行 撕题:非递归中序遍历二叉树 反问 总体感觉面试比较简单,上午面完,下午通知下周二面 9.13二面 (约20min) 自我介绍 问了一个比赛,大概十来分钟 反问 面完下来一查秒挂
上午在床上睡觉接到电话说要面试,推到下午了 时长:40min 1.自我介绍 2.项目深挖,问到了两个项目,主要包括背景,模型流程等 3.八股: 1)如何判断一个模型过拟合或者欠拟合? 2)如何解决过拟合? 3)L1L2正则有什么效果? 4.反问: 1)部门业务:菜鸟APP的推荐内容 2)是否介意没有相关背景的同学 3)后续流程?1-2轮技术面+hr面 4)base地情况 挺好的,面完秒挂
不用自我介绍,就是聊项目,面试官人特别好,我特别菜 大概讲了讲项目后做算法题, 第一题self-attention,用pytorch,继承pytorch.nn.Module写forward函数,没写出来,如果写出来了应该会继续写mask self-attention 第二题求前K个高频数 第三题二叉树 前序遍历中序遍历后序遍历 然后根据后序和中序结果写前序遍历 机器学习问了过拟合 决策树,xgb和
2024/08/29 14:00(50分钟) 这个岗位是学长内推的,不是我研究的方向所以没有项目,一面也没有八股啥的,主要考察了下代码能力和思考问题的能力吧 手撕:判断序列能否划分成两个和相等的子集(背包),网格路径最小(动态规划) 还一个概率论的题目就不透露了