产品概述

OrangePi AIpro AI Pro 开发板是香橙派联合华为精心打造的高性能 AI 开发板,其搭
载了昇腾 AI 处理器,可提供 8TOPS INT8 的计算能力,内存提供了 8GB 和 16GB
两种版本。可以实现图像、视频等多种数据分析与推理计算,可广泛用于教育、机
器人、无人机等场景。

技术规格

●处理器:昇腾AI处理器
●内存:8GB/16GB LPDDR4X
●AI算力:8TOPS INT8

相关的官网介绍链接

相关的资源下载页面

开箱感受

img

这款开发板的尺寸出乎意料地小巧,却配备了种类繁多的接口,令人惊喜。在它的底部,巧妙地设计了M.2插槽和eMMC插槽,极大地扩展了其功能性和应用范围。这样的设计,无疑使其成为开发者手中的神器,无论是进行快速原型开发还是复杂的系统集成,都能轻松应对。

远程登录

img

要进行远程登录到OrangePi AIpro,首先需要将其连接到路由器。完成网络连接后,您可以通过SSH(安全外壳协议)来访问设备。OrangePi AIpro的操作系统镜像提供了两个默认账户,分别是root和HwHiAiUser,两者均使用相同的默认密码:Mind@123。使用这些凭据,就可以轻松地通过SSH客户端进行远程登录,开始开发和管理工作。

img

通过使用MobaXterm这款强大的工具,您可以轻松地实现对后台的远程访问。MobaXterm集成了多种网络工具,包括SSH客户端,使得登录过程既简单又高效。

img

从图中的登录信息可以看出OrangePi AIpro AI Pro系统是基于Ubuntu 22.04.3 LTS,这是一个长期支持版本(LTS),意味着它会得到官方的长期更新和支持。系统运行在GNU/Linux 5.10.0内核上,这是一个针对ARM架构的64位操作系统(aarch64)。

性能测试

安装sysbench,进行CPU的测试

(base) root@orangepiaipro:~/workspace# apt-get install sysbench
# CPU测试
(base) root@orangepiaipro:~/workspace# sysbench --threads=32 --time=30 --report-interval=2 cpu run
sysbench 1.0.20 (using system LuaJIT 2.1.0-beta3)

Running the test with following options:
Number of threads: 32
Report intermediate results every 2 second(s)
Initializing random number generator from current time


Prime numbers limit: 10000

Initializing worker threads...

Threads started!

[ 2s ] thds: 32 eps: 6146.86 lat (ms,95%): 36.24
[ 4s ] thds: 32 eps: 6169.01 lat (ms,95%): 36.24
[ 6s ] thds: 32 eps: 6172.73 lat (ms,95%): 36.24
[ 8s ] thds: 32 eps: 6155.33 lat (ms,95%): 36.24
[ 10s ] thds: 32 eps: 6171.79 lat (ms,95%): 36.24
[ 12s ] thds: 32 eps: 6171.08 lat (ms,95%): 36.24
[ 14s ] thds: 32 eps: 6170.69 lat (ms,95%): 36.24
[ 16s ] thds: 32 eps: 6150.85 lat (ms,95%): 36.24
[ 18s ] thds: 32 eps: 6171.29 lat (ms,95%): 40.37
[ 20s ] thds: 32 eps: 6174.61 lat (ms,95%): 39.65
[ 22s ] thds: 32 eps: 6171.01 lat (ms,95%): 40.37
[ 24s ] thds: 32 eps: 6167.69 lat (ms,95%): 38.25
[ 26s ] thds: 32 eps: 6170.74 lat (ms,95%): 36.24
[ 28s ] thds: 32 eps: 6173.65 lat (ms,95%): 36.24
[ 30s ] thds: 32 eps: 6174.03 lat (ms,95%): 36.24
CPU speed:
    events per second:  6167.62

General statistics:
    total time:                          30.0049s
    total number of events:              185082

Latency (ms):
         min:                                    0.48
         avg:                                    5.17
         max:                                  144.50
         95th percentile:                       36.24
         sum:                               957364.07

Threads fairness:
    events (avg/stddev):           5783.8125/1158.16
    execution time (avg/stddev):   29.9176/0.05

和RK3399的对比

root@rk3399:~# sysbench --threads=32 --time=30 --report-interval=2 cpu run
sysbench 1.0.11 (using system LuaJIT 2.1.0-beta3)

Running the test with following options:
Number of threads: 32
Report intermediate results every 2 second(s)
Initializing random number generator from current time


Prime numbers limit: 10000

Initializing worker threads...

Threads started!

[ 2s ] thds: 32 eps: 6176.61 lat (ms,95%): 24.38
[ 4s ] thds: 32 eps: 5974.44 lat (ms,95%): 24.83
[ 6s ] thds: 32 eps: 5821.99 lat (ms,95%): 24.83
[ 8s ] thds: 32 eps: 5695.55 lat (ms,95%): 24.83
[ 10s ] thds: 32 eps: 5618.86 lat (ms,95%): 24.83
[ 12s ] thds: 32 eps: 5591.61 lat (ms,95%): 21.89
[ 14s ] thds: 32 eps: 5588.07 lat (ms,95%): 21.89
[ 16s ] thds: 32 eps: 5583.49 lat (ms,95%): 21.89
[ 18s ] thds: 32 eps: 5584.50 lat (ms,95%): 21.89
[ 20s ] thds: 32 eps: 5586.96 lat (ms,95%): 21.89
[ 22s ] thds: 32 eps: 5565.97 lat (ms,95%): 21.89
[ 24s ] thds: 32 eps: 5548.98 lat (ms,95%): 21.89
[ 26s ] thds: 32 eps: 5514.94 lat (ms,95%): 21.89
[ 28s ] thds: 32 eps: 5469.75 lat (ms,95%): 21.89
[ 30s ] thds: 13 eps: 5455.84 lat (ms,95%): 21.89
CPU speed:
    events per second:  5650.86

General statistics:
    total time:                          30.0109s
    total number of events:              169617

Latency (ms):
         min:                                  0.56
         avg:                                  5.65
         max:                                 68.07
         95th percentile:                     21.89
         sum:                             958268.12

Threads fairness:
    events (avg/stddev):           5300.5312/148.45
    execution time (avg/stddev):   29.9459/0.04

通过对比OrangePi AIpro和RK3399的Sysbench测试结果,我们可以分析出两者的性能差异以及OrangePi AIpro的优势。

  1. CPU速度:
    OrangePi AIpro:6167.62 events per second
    RK3399:5650.86 events per second
    OrangePi AIpro在CPU速度上明显高于RK3399,这意味着它在处理相同数量的任务时,能够更快地完成。

  2. 总时间和总事件数:
    OrangePi AIpro:30.0049s,185082 events
    RK3399:30.0109s,169617 events
    在相同的测试时间内,OrangePi AIpro处理的事件数更多,进一步证明了其处理能力的优越性。

  3. 延迟:
    OrangePi AIpro:min 0.48ms,avg 5.17ms,max 144.50ms,95th percentile 36.24ms
    RK3399:min 0.56ms,avg 5.65ms,max 68.07ms,95th percentile 21.89ms
    虽然RK3399在平均延迟上略高,但其最大延迟和95th百分位延迟都远低于OrangePi AIpro,表明RK3399在处理高负载时的响应时间更加稳定。

  4. 线程公平性:
    OrangePi AIpro:events (avg/stddev) 5783.8125/1158.16,execution time (avg/stddev) 29.9176/0.05
    RK3399:events (avg/stddev) 5300.5312/148.45,execution time (avg/stddev) 29.9459/0.04
    OrangePi AIpro在事件处理上显示出更高的标准差,这可能意味着在多线程环境下的性能波动较大。而RK3399在执行时间的标准差上更低,表明其在多线程处理上更加稳定。

OrangePi AIpro的优势

更高的CPU速度和更多的总事件数:OrangePi AIpro在处理速度和任务吞吐量上表现出色,适合需要快速处理大量任务的应用场景。
更低的平均延迟:尽管最大延迟较高,但OrangePi AIpro在大多数情况下能够提供更快的响应时间。

IO口的使用

开发板的 40 pin 接口引脚的顺序如下图所示:

img

img

使用时需要注意的事项:

8号和10号口默认是用于Debug调试口,所以最好不要再接上使用,并且这个debug口是连着micro usb的。

从上面的图上看的话,算上复用的IO口。有两个串口(一个用于debug默认),两个I2C(一个是1.8v一个3.3v),一个SPI口,一个PWM口,用来做一些简单的传感器验证基本都够了。

镜像内部还内置了gpio_operate工具,用于设置GPIO管脚

(base) root@orangepiaipro:~/workspace# gpio_operate -h
Usage: gpio_operate <Command|-h> [Options...]
gpio_operate Command:
        -h                              : This command's help information.
        set_value                       : Set gpio pin value.
        get_value                       : Get gpio pin value.
        set_direction                   : Set gpio pin direction value.
        get_direction                   : Get gpio pin direction value.

这似乎只是用来配置GPIO的输入输出,和电平高低的工具。

总结

在本项目中,我们通过使用Sysbench这一强大的性能测试工具,对OrangePi AIpro AI芯片和RK3399芯片进行了深入的性能对比。测试配置为32个线程,持续时间为30秒,每2秒报告一次结果,以确保获得详尽且准确的性能数据。
通过对比分析,我们发现了OrangePi AIpro AI芯片在CPU性能方面的一些显著优势,这些优势使其在处理多线程和高负载任务时表现更为出色。此外,我们对OrangePi AIpro AI的GPIO口配置和引脚进行了详细的学习和了解,这不仅增强了我们对硬件操作的实际能力,也为未来的项目打下了坚实的基础。
总结而言,OrangePi AIpro AI芯片展现了其在性能和功能上的强大潜力,特别是在需要高性能计算和复杂硬件交互的应用场景中。通过本项目的学习和实践,我们不仅验证了OrangePi AIpro AI芯片的性能优势,还加深了对硬件配置和引脚功能的认识,为未来的开发工作提供了宝贵的经验和知识。

#参考资料
https://zhuanlan.zhihu.com/p/642590764

Logo

昇腾万里,让智能无所不及

更多推荐