使用 Equality 网络拓扑对多 exaflops 机器进行性能评估
在现代计算架构中,由于核心数量的增加,图论是重头戏。不断寻找更好的连接核心的方法是必不可少的。本文重新审视了一种新颖的弦环互连拓扑系统 Equality,以与之前的一些作品进行比较。本文详细介绍了构建 Equality 互连的过程、其特殊路由过程、选择配置的策略以及使用开源周期精确 BookSim 并评估其性能。提出了代表小型到大型计算设施的四个场景来评估网络性能。这项工作表明,在 16,384 各端点系统中,Equality 网络被证明是最有效的系统。结果还显示了扩展到 48-320K 和一百万个端点的 Equality 网络的稳定可扩展性。平等网络可调整以适应商品硬件,并在十种常见流量模型下具有弹性。建议将 Equality 网络拓扑用于构建高效的 multi-exaflops 超级计算机和数据中心。
介绍
高性能计算(HPC)是一种使用高端计算组件来协同处理普通计算机无法轻易解决的大规模任务的计算类型。计算组件通过 HPC 网络连接,以实现更高的效率。
HPC 网络与其他网络的不同之处在于,它通常寻求同步通信和计算,以便通信不会过多地中断计算以提高效率。HPC 网络还倾向于使用同类计算硬件,例如在整个实施过程中使用相同型号的交换机(具有相同数量的端口)、CPU 和加速器。由于大规模生产,系统中的同质产品确保每个组件的价格更低,并且在某些部件出现问题时通过及时更换来更直接地恢复。
黄等人。与一些流行的 HPC 网络拓扑(例如 2 层胖树、3 层胖树、3D 环面和 5D 环面)相比,已经展示了平等网络的潜力。在这项工作中,我们进一步分析了不同规模的 Equality 网络的性能,以与 Slim Fly、Dragonfly 和两种流行的网络拓扑 Fat-tree 和 Tori 进行比较。我们还扩展了对应用 Equality 网络的关注,以使机器能够根据当前的硬件工艺达到 multi-exaflops。
当前工作不同于以往工作的主要贡献包括:
平等网络系统路由表的开发和实施,
修改后的路由算法 bottleneck-UGAL 避免过度订阅路径,
除了二分带宽外,还介绍了一种称为二分比的新度量,
对各种规模的 Equality 网络的结果网络属性(直径、平均距离、延迟和吞吐量)的分析以及与其他现有出版物的比较,
利用 Equality 网络拓扑为未来 HPC 系统寻找合适配置的策略,以及
BookSim(一个 1 M 端点系统)计算过的最大的周期精确模拟。
网络架构
预先设计不同的网络拓扑通常是为了适应特定的工作负载而设计的。为了证明网络的质量以及它是否适合目标应用程序工作负载,可以检查网络的性能指标并在网络上进行额外的模拟。本文中使用的标准网络度量包括网络直径d和平均距离a。标准的通信度量是消息延迟和网络在不同流量模式和注入强度下的整体吞吐量。
一个平衡良好的拓扑应该有一个合理的网络直径,并伴随着定制的路由算法来减少延迟和增加吞吐量。然而,对于任何应用程序,如果特定应用程序的所有通信模式在网络中使用不超过跳,则给定网络具有有效直径实际网络直径。同样的想法也适用于平均跳数。d效果d效果
在低注入率下,当一个数据包从不与其他数据包争用资源时,延迟称为“零负载延迟”,,它是不涉及队列或阻塞时延迟位的总和。在高注入率下,当网络在特定负载、流量模式和路由算法下饱和时,如果延迟变高,则吞吐量接近饱和吞吐量。升0吨坐着
主要地,如果网络直径d减小,则可以减少延迟;然而,网络延迟和吞吐量仍然取决于实际应用程序的流量模式。几种流量模式是根据实际应用程序触发的通信模式设计的。例如,在转角和矩阵转置应用中会遇到转置交通模式。选择在大多数流量模式上优于其他网络的网络有助于打造更好的系统。
开关延迟
当代高端交换机的端口到端口延迟从几十纳秒到几微秒。开关延迟取决于很多参数,包括电缆长度、电缆材料、光电转换、缓冲区大小、开关逻辑周期频率、开关存储器访问时间、路由表大小、路由计算复杂度、跳数等。 硬件性能可以通过将每个逻辑元素贡献的所有指令周期相加,乘以每个周期的时间(以纳秒为单位)来计算。内存访问时间和逻辑频率等硬件问题不在本文讨论范围之内。
如果在选择交换硬件时每跳延迟是固定的,那么减少系统整体延迟的唯一方法是微调拓扑。实际上,消息可以在基于数据包的路由架构中的通道缓冲区中等待,或者在虫洞路由架构中等待通道被释放。在网络拥塞的情况下,跳跃距离对网络延迟的影响可能较小;因此,拓扑结构和路由算法的设计不应只关注网络的直径。
IP地址#头条显示IP属地##知乎宣布全面上线显示用户IP属地##微信将展示用户IP属地#
一、概述
当设备连接网络,设备将被分配一个IP地址,用作标识。通过IP地址,设备间可以互相通讯,如果没有IP地址,我们将无法知道哪个设备是发送方,无法知道哪个是接收方。IP地址有两个主要功能:标识设备或网络和寻址。
常见的IP地址分为 IPv4 与 IPv6 两大类,IP地址由一串数字组成。IPv4为32位长,通常书写时以四组十进制数字组成,并以点分隔,如:172.16.254.1 ; IPv6为128位长,通常书写时以八组十六进制数字组成,以冒号分割,如:2001:db8:0:1234:0:567:8:1。
二、功能
IP地址有两个主要的功能:
标识主机:更具体地说,标识其网络接口,并且提供主机在网络中的位置。
网络寻址:网际协议(缩写:IP)的一个重要机制就是网络寻址(英语:internet address)。该功能的目的是将数据报从一个网络模块送到目的地。在发送的整个过程,IP地址(address)充当着目的地的位置,域名(name)意味着我们要找什么,路由(route)代表着如何到达目的地的这个过程。每个IP数据包的标头包含了发送主机的IP地址和目的主机的IP地址。
三、IP地址的分配
IP地址是在主机加入网络时动态分配的,还是通过主机硬件/软件的配置永久分配给主机的。永久性的配置也称为使用静态IP地址。相反,在每次重新启动时分配的IP地址,称为使用动态IP地址。
动态IP地址是通过网络使用动态主机配置协议(DHCP)分配的。DHCP是分配地址最常用的技术。它避免了为网络上的每台设备分配特定静态地址的管理负担。如果某些设备在特定的时间处于联机状态,它还允许设备共享网络上有限的地址空间。通常,在现代的台式计算机操作系统中,默认情况下会启用动态IP地址分配。
DHCP分配的地址于租约相关联,并且一般都是具有有效期。如果主机在到期前未能续订租约,则可以将该地址分配给其他设备中的一台设备。某些DHCP实现会在主机每次加入网络时根据其MAC地址尝试将相同的IP地址重新分配给该主机。网络管理员可以通过基于MAC地址分配特定的IP地址来配置DHCP。
DHCP并不是唯一一种动态IP地址分配技术。Bootstrap协议是DHCP的类似协议和前身。拨号和某些宽带网络使用点对点协议的动态地址功能。
用于网络设施的计算机和设备(例如:路由器或者邮件服务器等),通常配置为静态地址分配。
在动态或者静态地址分配失效的情况下,操作系统可以将无状态地址自动配置,将链接本地的地址分配给主机。
美国搭建无线电力传输网络
美国国防高级研究计划局(DARPA) ,正在推进其持久性光无线能量中继项目 (POWER),该项目旨在为未来美军开发和建立,无线电力传输网络构建可行性模型,POWER将分为三个主要阶段,通过开发高功率的能量发射系统,以及陆地和空中基站,建立一个能量传输的发射和转换网络模型,POWER项目将对无线电力传输的实用性进行验证,并开发演示阶段的相关装备
——
Persistent Optical Wireless Energy Relay (POWER)
持久性光无线能量中继项目
——
美国国防高级研究计划局
Defense Advanced Research Projects Agency(DARPA)
美国国防高级研究计划局成立于1958年,总部位于美国弗吉尼亚州阿灵顿县,是美国国防部负责研发军用高科技项目的主要机构之一,美国国防高级研究计划局直属于美国国防部管理,是高级别、独立的军事研发机构
——部分由美国国防高级研究计划局主导的科研项目:
- ARPANET 阿帕网
美国国防高级研究计划局开发的世界上首个运营的数据包交换网络,是如今全球互联网的建立提供了启发
-The Mother of All Demos 所有演示之母
1968年12月,道格拉斯·恩格尔巴特在计算机协会暨电气电子工程师学会的秋季会议上,展示了一个完整的计算机软硬件系统,其中涵盖了现代计算机包括的几乎所有的基本要素,例如窗口,TXT,图形,导航和命令输入,视频会议,鼠标,文字,文件链接等等,这些在当时非常超前的理念也直接影响了如今苹果公司的MAC OS系统,以及微软公司的WINDOWS操作系统
-高频主动式极光研究计划HAARP
High Frequency Active Auroral Research Program
HAARP的主要课题是在对大气层中最上层的电离层进行研究,其研究成果可能被应用于战略通信领域,也有观点认为该项目可能被美国用于气象站,通过影响电离层而导致局部的天气变化
#武器沙漏# #美国搭建无线电力传输网络# #DARPA#
COVID-19 危机期间的智能 DDoS 保护
正如视频会议软件、远程医疗服务和政府网站的流量高峰所表明的那样,组织需要一种区分恶意流量和合法流量高峰的方法。
然而,问题在于,仅查看原始流量率并不能告诉我们该流量是合法的还是恶意的。例如,下面的屏幕截图将 flash crows 与 TCP RST Flood进行了比较。
仅使用速率分析,两个请求看起来都一样。然而,对数据包行为的更详细的行为分析表明,恶意流量与已建立的合法用户行为基线存在显着偏差。
这就是为什么反 DDoS 防御不仅要利用基于体积的检测,还要利用基于行为的检测方法至关重要的原因。在大规模的闪电人群中,这是真正区分攻击者和有需要的患者的唯一方法。
实时签名
阿尔伯特·爱因斯坦说:“一切都应该尽可能简单,但不能简单。” 将其解释为 DDoS 保护的世界,这意味着攻击签名应该针对传入攻击流量的确切特征进行定制,但不能或多或少地涵盖。
签名应用太窄,意味着攻击流量不会被拦截;应用过于广泛的签名,合法的用户流量也会被阻止。
传统的 DDoS 防御通常基于传入流量的速率限制,从而将整体流量降低到服务可以承受的水平。然而,问题在于速率限制是一种蛮力机制,它任意“限制”流量,但不区分合法流量和恶意流量。这会导致高度误报,导致合法用户被阻止,而一些恶意流量仍然可以通过。
更好的方法是使用实时签名创建算法,该算法针对攻击模式的确切特征进行了微调和优化,这意味着恶意流量——并且只有恶意流量——将被阻止,而合法用户、患者和客户不会被中断.
加密攻击防护
随着越来越多的 Web 流量被加密,针对加密洪流的保护是现代 DDoS 保护的一项关键要求。根据 Google 的 HTTPS 透明度报告,现在几乎所有主要市场中超过 90% 的网页都使用 HTTPS 加密。
这在冠状病毒危机期间尤其适用,当时许多人都在远程工作并通过安全连接共享机密的财务细节、工作材料或患者数据。
具有讽刺意味的是,虽然 HTTPS 对于数据保护至关重要,但它也为新型破坏性 DDoS 攻击打开了大门。HTTPS 是一种高度不对称的协议,SSL 握手过程从目标服务器获取的资源可能比从发出请求的主机获取的资源多15 倍。因此,黑客可以使用 HTTPS 泛洪攻击以相对较少的请求数进行破坏性攻击。
这就是为什么防御加密的 DDoS 洪水是现代 DDoS 保护的关键要求。
庞大的全球产能
保护关键服务可用性的另一个关键要求是大规模、专用的 DDoS 缓解能力。
物联网僵尸网络不断变得更大、更复杂,并且能够发起比以往更大的攻击。例如,以色列本古里安大学 (BGU) 的研究人员最近进行的一项研究表明,一个只有 6,000 个节点的中型僵尸网络如何破坏美国普通州的紧急 911 系统,以及 200,000 个僵尸网络如何危害整个美国。
自然,在 COVID-19 危机等大规模突发公共卫生事件期间,此类漏洞至关重要。
解决方案是依靠全球分布式 DDoS 清理网络,该网络具有多 TB 的专用DDoS 缓解能力,以确保您始终拥有足够的后备能力。
托管安全服务
最后,现代 DDoS 保护的最后一个关键要求是完全托管的安全服务。员工短缺和网络安全技能差距是日常的关键问题,但在危机时期,当 IT 团队过度扩张,许多员工在家工作,有些人甚至可能受到封锁的影响时,这些挑战会更加严重,隔离,或住院。
使用完全托管的安全服务进行 DDoS 保护,依靠以网络和应用程序安全为专长的专家团队,有助于减轻您的负担。这使 IT 团队能够腾出带宽来专注于他们的核心任务,并将安全管理留给专家。