专用架构与AI软件栈

2021/12/11 技术 DSA

本文来自知乎mackler，作者是清华计算机博士，其中是他对于DSA和AI软件栈问题的思考，文章很有洞察力，写得非常棒。

开个新系列，聊一聊专用架构和AI软件栈的问题。这个题目比较大，涉及面非常广，和之前的文章一样，我一般观点都比较激进，对于现有方法的缺点一般是毫不掩饰，各位看官请酌情食用，另外我也会抛出一些全新的解决思路。

这篇文章主要先聊硬件，AI软件栈的复杂性和根本性难题其实主要来源于硬件。如果硬件只是GPU，尤其是是Volta架构之前的GPU，其实AI软件栈根本不用这么复杂，所以我们先来讲讲硬件架构，也是我的老本行。

体系结构领域大的创新其实已经停滞了很多年了，虽然说这么多年硬件的提升一半是靠摩尔定律，一半是靠体系结构革新，作为一个做arch的，我原先也非常相信arch在其中的作用。但实际情况是，arch的“创新”其实很大程度依赖于工艺的演进。arch领域最近几年最常见的论调是摩尔定律要完蛋了，arch即将成为硬件性能的主要推动力，似乎未来架构要在工艺不变的情况下纯靠架构演进原地起飞。实际并不是，脱离了工艺的演进，架构带来收益非常困难！

架构的收益其实更多是工艺演进时，新约束下新tradeoff带来的超额收益。以前我也不明白这一点，因为理论上讲，架构只是电路逻辑，什么工艺下都可以做。但实际上工艺可以打开设计的空间，因为相同的面积功耗限制下，新工艺可以放更多的逻辑，我们就可以把原有架构的各个部分超级加倍，比如cache变大，发射数增大。但随之而来原先架构不突出的问题可能就变得明显，此时就需要调整架构，比如cache太大了就可以再加一级，利用率可以更高，从而获得超额的提升（相比简单根据工艺scale）。所以本质上讲，不同工艺带来的不同约束下，架构设计是有不同tradeoff选择的，所谓架构收益更多是这种新tradeoff带来的超额提升。但如果约束保持不变，其实最佳的tradeoff很快就收敛了，后面想继续靠arch压榨出更多性能就非常困难了。

阅读全文

学而时习之，不亦说乎？有朋自远方来，不亦乐乎？人不知而不愠，不亦君子乎？

2021/10/17 读书

曹仰峰老师是北大光华管理教授，著名人力资源管理专家，因华为战马读书社邀请，来讲了《组织韧性-如何穿越危机持续成长》课程，结束后又与大家交流个人韧性与成长，也回答了很多现场和线上同学的提问，还是满接地气的一个学者。

这里记录老师的一小段回答。

论语里面有三句话：“学而时习之，不亦说乎？有朋自远方来，不亦乐乎？人不知而不愠，不亦君子乎？”

这几句话特别重要，我可以简单地说一下，第一句话，原来很多人都理解得稍微有点浅。我读书的时候我们老师教我们说学习要经常复习一下，是很快乐一件事情。当时觉得这玩意儿没错呀，但深想下论语是写给那些古代的领导者的，后来不断地读原文和一些人交流，就发现有的人解读完全不同。他说那个学习的学字，是觉悟的觉，那是个通假字，习不是温习复习，而是进退。习那是个繁体字，是小鸟练习飞翔，一会进一会退。

第一句话，学而时习之，指得什么呢？如果一个人能觉察到与时代同进退，这是大智慧。那你想这句话的理解，这就马上境界就不一样了。

第二句话，有朋自远方来，不亦乐乎。这个朋字啊，繁体字是朋加个鸟，古代对朋友的定义比今天要严格很多，那个鹏指的是共同的志向，是共同干大事的，我们现在朋友一来，一起喝两杯酒，说有朋自远方来，不亦乐乎，喝两杯小酒不叫朋友，严格来讲，不是那个时候的朋友。朋友是要共同干一些大事的人、是共同志向的人。

第三句话，人不知而不愠，不亦君子乎。为什么呢，是因为大多数情况下你很难让每个人都非常的理解你，坦率的讲很难，你不能够老是给自己贴个标签，如果你活在别人的嘴里，活在别人的眼睛里，这样的人生是很悲催的。所以我就觉得认真体悟到这三句话，身上就有无穷的力量。

阅读全文

零拷贝Zero-Copy技术

2021/07/09 技术 Zero-Copy

看到的很好的解释零拷贝的文章，大量优质图示很好理解，写的真是不错啊，转载转载。。

原文转载自微信公众号「后端技术指南针」，作者指南针氪金入口。

扩展阅读:

架构师小秘圈

Kafka和RocketMQ底层存储：零拷贝技术

原来 8 张图，就可以搞懂零拷贝了

RDMA技术详解（一）：RDMA概述

前言

像大白这种调包侠，深知不懂底层技术点就如同空中楼阁，再这样下去面阿里p10是没希望了。

想到这里，我开始慌了，所以今天和大家一起学习个底层技术点-零拷贝Zero-Copy。

Linux系统中一切皆文件，仔细想一下Linux系统的很多活动无外乎读操作和写操作，零拷贝就是为了提高读写性能而出现的。

废话不多说，马上开大车，走起!

数据拷贝基础过程

在Linux系统内部缓存和内存容量都是有限的，更多的数据都是存储在磁盘中。对于Web服务器来说，经常需要从磁盘中读取数据到内存，然后再通过网卡传输给用户：

上述数据流转只是大框，接下来看看几种模式。

阅读全文

软件工程

2020/08/21 生活软件

软件之难，不在于技术而在于工程;

工程之难，不在于流程而在于组织;

组织之难，不在于管理而在于文化;

注解：

现代软件大多通过开源组件的堆叠组合形成，软件实践中的技术问题可以大多通过找寻资源得到解决，技术已经不是现代软件开发工作中的难点。软件的工程学要求我们把软件作为工程去建设、管理和维护，这涉及到项目的架构设计／演进、项目各生命周期管理等多学科交融知识，是一门复杂而有难度的工程学实践活动。
工程的难度不在流程，流程是可以固化的、一尘不变的死的东西，影响工程的是组织架构。康威定律告诉我们，一个好的工程需要一个健康的组织架构，好的组织反哺软件，坏的组织结构则破坏软件。
组织的难度不在于管理而是文化，文化是企业的基因，没有好的基因就没有好的政策，就得不到好的组织，就做不好工程，就没有好软件！

阅读全文

培训总结感悟

2018/12/15 生活

一代人有一代人的使命

华为从ict起步，如今消费者bg业务蓬勃发展，公司的愿景是万物互联，需要每一代华为人奋斗不息

人只有走出舒适区的时候才是成长最快的时候

勇于改变，应对挑战

人力资源走在业务之前招聘有一个周期人力资源要具有前瞻性

眼界决定境界定位决定地位

不要给自己设上限，给自己设下线，做好内外遵循

机会是创造出来的

工作中不要只盯着PBC，多做一些”无关”的小事

登山的团队中，人们都会带一些小西红柿牛肉干等小零食（苹果、梨子不好与人分享），从而拉近彼此的距离

构建强大的社会支持系统交有能力的朋友才会让你更加进步

优秀的人具有全情投入的能力巅峰时刻应该时刻都要有

阅读全文

专用架构与AI软件栈

学而时习之，不亦说乎？有朋自远方来，不亦乐乎？人不知而不愠，不亦君子乎？

零拷贝Zero-Copy技术

前言

数据拷贝基础过程

软件工程

培训总结感悟

一代人有一代人的使命

人只有走出舒适区的时候 才是成长最快的时候

人力资源走在业务之前 招聘有一个周期 人力资源要具有前瞻性

眼界决定境界 定位决定地位

不要给自己设上限，给自己设下线，做好内外遵循

机会是创造出来的

构建强大的社会支持系统 交有能力的朋友才会让你更加进步

优秀的人具有全情投入的能力 巅峰时刻应该时刻都要有

人只有走出舒适区的时候才是成长最快的时候

人力资源走在业务之前招聘有一个周期人力资源要具有前瞻性

眼界决定境界定位决定地位

构建强大的社会支持系统交有能力的朋友才会让你更加进步

优秀的人具有全情投入的能力巅峰时刻应该时刻都要有