课程描述
本课程全面介绍计算机视觉。主要主题包括图像处理、检测和识别、基于几何和基于物理的视觉和视频分析。学生将学习计算机视觉的基本概念以及解决实际视觉问题的实践经验。
前提条件
本课程要求熟悉线性代数、微积分、基本概率以及编程。特别是,以下课程是先决条件:
- 《电气工程数学基础》(18-202)和《强制计算原理》(15-122)(OR)
- 《矩阵代数及其应用》(21-240)、《矩阵与线性变换》(21-231)、《三维微积分》(21-259)和《祈使计算原理》(15-122)
Matlab将用于项目作业,并将作为课程简介的一部分进行介绍。
教科书
阅读材料将从以下教科书中指定(在线免费提供):
其他阅读材料将从相关论文中指定。阅读材料将张贴在每堂课的最后一张幻灯片上。
以下教科书也可以作为课堂不同部分的有用参考,但不是必需的:
- 计算机视觉中的多视图几何,理查德·哈特利和安德鲁·齐瑟曼。
- 计算机视觉:现代方法,大卫·福赛斯和让·庞斯。
- 数字图像处理,拉斐尔·冈萨雷斯和理查德·伍兹。
评价
你的最终成绩将由以下部分组成:
- 七个编程作业(70%)。
- 11次随堂测验(27%)。
- 课堂参与率(3%)。
编程作业:编程作业(PA)需要实现重要的计算机视觉算法。其中一些还将包含与实施相关的小型理论部分。编程将在Matlab(PA1)和Python(PA2-7)中完成。
随堂测验:随堂测验(TQ)需要解决与相应周的两堂课相关的两到三个理论问题。答案需要用LaTeX输入。
迟到天数:对于编程作业,学生将被允许总共六最近几天有空。任何额外的逾期天数将被处以10%的罚款。
错过的测验:对于即兴测验,学生将被允许完全跳过总共三测验不受惩罚。对于提交八次以上测验的学生,只有最好的八次才会计入成绩。测验没有免费的迟到天数,任何迟到的测验都将获得零学分。
提交作业:我们使用帆布用于提交和评分作业。
电子邮件、办公时间和讨论
电子邮件:给教职员工发电子邮件时,请在标题中使用[16385]!
办公时间:所有办公时间都在史密斯霍尔200会议室。
- 周一下午4-6点阿南德。
- 星期二下午4-6点普拉哈尔。
- 周四下午4-6点亚尼斯。
- 周五下午4-6点亚尼斯。
请随时给我们发送电子邮件,告知我们如何安排额外的办公时间。
教学大纲和时间表
以下教学大纲是实验性的并且很可能在学期内发生变化。每场讲座结束后,本网站将更新幻灯片。
日期 | 话题 | 幻灯片 | 作业 |
M、 1月13日 | 介绍 | pdf格式,pptx公司 | |
W、 1月15日 | 图像过滤 | pdf格式,pptx公司 | |
M、 1月20日 | 不上课(马丁·路德·金日) | | |
W、 1月22日 | 图像金字塔和傅立叶变换 | pdf格式,pptx公司 | PA1输出 |
M、 1月27日 | 霍夫变换 | pdf格式,pptx公司 | TQ1输出 |
W、 1月28日 | 特征和角点检测 | pdf格式,pptx公司 | |
M、 2月3日 | 特征描述符和匹配 | pdf格式,pptx公司 | TQ1到期,TQ2输出 |
W、 2月5日 | 2D变换 | pdf格式,pptx公司 | PA1到期,PA2输出 |
M、 2月10日 | 二维变换(续) | pdf格式,pptx公司 | TQ2到期,TQ3输出 |
W、 2月12日 | 图像单形文字 | pdf格式,pptx公司 | |
苏,2月16日 | | | TQ4输出 |
M、 2月17日 | 摄像头型号 | pdf格式,pptx公司 | TQ3到期 |
W、 2月19日 | 摄像头型号(续) | pdf格式,pptx公司 | PA2到期,PA3输出 |
苏,2月23日 | | | TQ4到期,TQ5输出 |
M、 2月24日 | 双视图几何图形 | pdf格式,pptx公司 | |
W、 2月26日 | 立体声 | pdf格式,pptx公司 | |
苏,3月1日 | | | TQ5到期,TQ6输出 |
M、 3月2日 | 辐射和反射率 | pdf格式,pptx公司 | |
W、 3月4日 | 关于辐射测量的更多信息 | pdf格式,pptx公司 | PA3到期 |
M、 3月9日 | 无课(春假) | | |
W、 3月11日 | 无课(春假) | | |
M、 3月16日 | 无类别(Covid-19过渡) | | |
W、 3月18日 | 光度立体和着色形状 | pdf格式,pptx公司 | PA4输出 |
苏,3月22日 | | | TQ6到期,TQ7输出 |
M、 3月23日 | 图像处理管道 | pdf格式,pptx公司 | |
W、 3月25日 | 图像分类 | pdf格式,pptx公司 | PA4到期,PA5输出 |
苏,3月29日 | | | TQ7到期,TQ8输出 |
W、 3月30日 | 工程包 | pdf格式,pptx公司 | PA4到期,PA5输出 |
W、 4月1日 | 神经网络 | pdf格式,pptx公司 | |
苏,4月5日 | | | TQ9输出 |
M、 4月6日 | 更多神经网络 | pdf格式,pptx公司 | TQ8到期 |
W、 4月8日 | 卷积神经网络 | pdf格式,pptx公司 | PA5到期,PA6输出 |
苏,4月12日 | | | TQ10输出 |
M、 4月13日 | 更多卷积神经网络 | pdf格式,pptx公司 | TQ9到期 |
W、 4月15日 | 光流 | pdf格式,pptx公司 | |
F、 4月17日 | 对齐 | pdf格式,pptx公司 | |
苏,4月19日 | | | TQ10到期 |
M、 4月20日 | 跟踪 | pdf格式,pptx公司 | |
W、 4月22日 | 分割和基于图的技术 | pdf格式,pptx公司 | PA6到期,PA7输出,TQ11输出 |
苏,4月26日 | | | |
M、 4月27日 | 细分 | pdf格式,pptx公司 | |
W、 4月29日 | 运动和包裹的结构 | 个人数字一代/pdf2,第1页/第2页 | |
苏,5月3日 | | | PA7到期,TQ11到期 |
特别感谢
这些讲稿是由许多不同的人和地方拼凑而成的。特别感谢同事们分享他们的幻灯片:克里斯·基塔尼、鲍勃·柯林斯、斯里尼瓦萨·纳拉希曼、马特里赫伯特、阿利奥沙·埃夫罗斯、阿里·法哈拉迪、德瓦·拉马南、亚瑟·谢赫和托德·齐克勒。非常感谢以下人士在网上提供了他们的讲稿和材料:史蒂夫·塞茨、理查德·塞利斯基、拉里·齐特尼克、诺亚·斯纳维利、拉娜·拉泽布尼克、克里斯汀·格劳曼、容玉闯、丁·图伊特拉斯、李菲菲、安东尼奥·托拉尔巴、罗伯·弗格斯、大卫·克劳斯和丹·尤拉夫斯基。