用香橙派AIpro部署大模型、安装宝塔搭建私有随身WEB开发环境

# 用香橙派AIpro部署大模型、安装宝塔搭建私有随身WEB开发环境

# 什么是香橙派

Orange Pi AI Pro 开发板是香橙派联合华为精心打造的高性能 AI 开发板,其搭载了昇腾 AI 处理器,可提供 8TOPS INT8 的计算能力,内存提供了 8GB 和 16GB两种版本。可以实现图像、视频等多种数据分析与推理计算,可广泛用于教育、机器人、无人机等场景。

如果你有一块香橙派AIpro你会拿来做什么?

今天就跟大家介绍一下我会用这个香橙派AIpro做什么。

1.香橙派AIpro部署大语言模型

2.利用香橙派AIpro安装LNMP(宝塔面板)搭建私有的Wordpress博客WEB系统

xiangchengpai-aipor

# 基础配置

香橙派 AIpro

CPU:昇腾AI技术路线 (听群友说是 A55)

内存:8GB/16GB LPDDR4X (我拿到的是8G的版本)

HDMI 2.0输出 2个

千兆网口: 1个

USB3.0 ,有2个

USB Type-C 3.0 ,1个

Wi-Fi5+蓝牙4.2

支持SATA/NVMe SSD 2280的M.2插槽

可外接32GB/64GB/128GB/256GB eMMC模块

Type-C供电

image-20240522172207326

详细信息请查看: http://www.orangepi.cn/html/hardWare/computerAndMicrocontrollers/details/Orange-Pi-AIpro.html

# 外壳

image-20240529154147128

# 主板和电源

image-20240529154208894

# 正面图片

image-20240522173608688

# 背面图

image-20240522173642488

# ubuntu系统固定IP

把香橙派AIpro的电源插上,连接显示器键盘鼠标和网线,开机风扇声音还挺大,不过进入系统后风扇声音变小。

$ ifconfig 查看IP
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.1.245  netmask 255.255.255.0  broadcast 192.168.1.255
        inet6 fe80::9f02:c0dd:c615:4468  prefixlen 64  scopeid 0x20<link>
        ether c0:74:2b:fe:29:42  txqueuelen 1000  (Ethernet)
        RX packets 453623  bytes 66206481 (66.2 MB)
        RX errors 0  dropped 1595  overruns 0  frame 0
        TX packets 4999  bytes 957506 (957.5 KB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
wlan0: flags=4099<UP,BROADCAST,MULTICAST>  mtu 1500
        ether 7c:88:99:ff:79:ec  txqueuelen 1000  (Ethernet)
        RX packets 0  bytes 0 (0.0 B)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 0  bytes 0 (0.0 B)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

查看到有两个网卡,一个是有线,一个无线。

ubuntu系统固定IP:

我这里把香橙派的IP固定为 192.168.1.22,免得重启或者IP被局域网的占用的情况。

$ sudo -i
# cd /etc/netplan
#ls -l
total 20
-rw-r--r--   1 root root   164 Jan 30 12:19 01-netcfg.yaml

备份文件:
# cp 01-netcfg.yaml 01-netcfg.yaml-bak
# vim 01-netcfg.yaml

填入网络配置模版
1
2
3
4
5
6
7
8
9
10
11

ubuntu22.04 参考以下配置模板如下

network:
  ethernets:
    eth0: # 网卡名称
      dhcp4: no #关闭ipv4动态分配ip地址
      dhcp6: no #关闭ipv6动态分配ip地址
      addresses: 
          - 192.168.1.22/24  # 设置的子网IP和子网掩码,192.168.1.22代表IP /24代表掩码255.255.255.0
      routes:
          - to : default 
            via: 192.168.1.1   # 网关
      nameservers:
          addresses:  # DNS服务器
             - 114.114.114.114
             - 8.8.8.8
  version: 2
  renderer: networkd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

加载配置和重启网络

修改好网卡配置文件后通过下面命令生效
# netplan apply

重新网络
# systemctl restart systemd-networkd
1
2
3
4
5

# SSH远程连接

Ubuntu 22.04.3 LTS

下载SSH软件例如: MobaXterm 或者 Putty

我习惯用 SecureCRT

如图填写IP,端口,用户和密码,这个IP是没改之前的请忽略。

image-20240522180029942

进入远程

image-20240522183401338

# 远程连接VNC

官方镜像默认安装了VNC,我这里用 vncviewer 软件

image-20240524192426294

就可以用vnc远程控制香橙派了

image-20240524192504613

# 挂载硬盘

我在板子后面添加了一块1T的SSD,并且挂载到/www目录下

(base) HwHiAiUser@orangepiaipro:~$ sudo -i
[sudo] password for HwHiAiUser: 
输入密码,切换到root用户

查看硬盘:
# df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/root        29G   17G   12G  60% /
tmpfs           3.7G  4.0K  3.7G   1% /dev/shm
tmpfs           1.5G   15M  1.5G   1% /run
tmpfs           5.0M     0  5.0M   0% /run/lock
tmpfs           4.0M     0  4.0M   0% /sys/fs/cgroup
tmpfs           128M  772K  128M   1% /var/log
/dev/mmcblk1p3   50M  2.0K   50M   1% /exchange
tmpfs           755M   76K  755M   1% /run/user/0
tmpfs           755M   80K  755M   1% /run/user/1000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
查看硬盘:
fdisk -l
Disk /dev/nvme0n1: 953.87 GiB, 1024209543168 bytes, 2000409264 sectors
Disk model: Predator SSD GM7000 1TB                 
.....
Device          Start        End    Sectors  Size Type
/dev/nvme0n1p1   4096     618495     614400  300M EFI System
/dev/nvme0n1p2 618496 1999204351 1998585856  953G Microsoft basic data
.....

可以看到有一块1T的SSD,再挂载硬盘

mkdir /www
mount /dev/nvme0n1p2 /www  # 可以直接挂载

也可以先格式化再挂载:
mkfs.ext4 /dev/nvme0n1p2
mount /dev/nvme0n1p2 /www

df -h|grep www
/dev/nvme0n1p2  953G  528M  953G   1% /www

vim /etc/fstab
增加:
/dev/nvme0n1p2  /www ext4 defaults 0 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

至此准备工作完毕,下面就介绍用香橙派AIpro搭建本地的模型。

# 香橙派AIpro部署大语言模型

Ollama运行llama3、qwen等大模型,虽然有些小马拉大车,我还是想试试它的极限在哪里

# 安装Ollama

# 方法1、命令行下载安装(耗时长)

安装命令:

$ sudo apt  install curl

$ curl -fsSL https://ollama.com/install.sh | sh
1
2
3

image-20240517160657340

缺点: 国内网络环境要等很久

# 方法2 、手动下载安装(推荐使用)

1.手动下载 https://ollama.com/install.sh 这个文件

# mkdir /www/ollama
cd /www/ollama
# wget https://ollama.com/install.sh
1
2
3

2.注释掉下载部分 curl xxxx 手动下载ollama-linux-{ARCH}

# vim install.sh

修改文件:
status "Downloading ollama..."
#curl --fail --show-error --location --progress-bar -o $TEMP_DIR/ollama "https://ollama.com/download/ollama-linux-${ARCH}${VER_PARAM}"
1
2
3
4
5

香橙派 AIpro的CPU是ARM架构的,所以 {ARCH} = arm64

浏览器下载: https://ollama.com/download/ollama-linux-arm64

如果CPU是intel或者AMD则:{ARCH} = amd64,https://ollama.com/download/ollama-linux-amd64

当然科学上网速度更快哟。 放在 install.sh 同目录下

3.注释掉 #$SUDO install -o0 -g0 -m755 $TEMP_DIR/ollama $BINDIR/ollama

改为下面一行:

# vim install.sh

修改文件:
status "Installing ollama to $BINDIR..."
$SUDO install -o0 -g0 -m755 -d $BINDIR
#$SUDO install -o0 -g0 -m755 $TEMP_DIR/ollama $BINDIR/ollama
$SUDO install -o0 -g0 -m755 ./ollama-linux-arm64  $BINDIR/ollama
1
2
3
4
5
6
7

4.运行 install.sh ,安装

(base) root@orangepiaipro:/www/ollama# ll
total 285868
drwxr-xr-x 2 root root      4096 May 23 10:20 ./
drwxr-xr-x 4 root root      4096 May 23 10:04 ../
-rw-r--r-- 1 root root     10158 May 23 10:20 install.sh
-rw-r--r-- 1 root root 292706744 May 23 10:17 ollama-linux-arm64

# sh  ./install.sh
1
2
3
4
5
6
7
8

image-20240523102150518

重启电脑

# 更改模型存放的路径

由于系统盘空间有限,如果不修改模型存放位置默认会在 /usr/share/ollama/.ollama/models 或者 /root/.ollama/models/ 目录。

# mkdir /www/ollama/ollama_models

# cd /etc/systemd/system/
# vim /etc/systemd/system/ollama.service
在 environment里面分号隔开添加OLLAMA_MODELS环境变量

OLLAMA_MODELS=/www/ollama/ollama_models;
如下图
1
2
3
4
5
6
7
8

image-20240523103347948

加载配置并且重启ollama生效

source ollama.service
systemctl daemon-reload
systemctl restart ollama
1
2
3

# 启动ollama服务

# ollama --help
Large language model runner

Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       Start ollama
  create      Create a model from a Modelfile
  show        Show information for a model
  run         Run a model
  pull        Pull a model from a registry
  push        Push a model to a registry
  list        List models
  ps          List running models
  cp          Copy a model
  rm          Remove a model
  help        Help about any command

Flags:
  -h, --help      help for ollama
  -v, --version   Show version information

Use "ollama [command] --help" for more information about a command.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

提示

star@star-ai:~$ ollama serve
Couldn't find '/home/star/.ollama/id_ed25519'. Generating new private key.
Your new public key is: 

ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIPmYsSi6aIsyhC4EHEsCdBtSOqnfKmNVSf0Ofz9sVzyB

Error: listen tcp 127.0.0.1:11434: bind: address already in use

1
2
3
4
5
6
7
8

说明已经运行

重新加载配置,重启ollama

systemctl daemon-reload

systemctl restart ollama

ollama serve

关闭服务
systemctl stop ollama
启动服务
systemctl start ollama
1
2
3
4
5
6
7
8
9
10

# 运行qwen大模型

ollama run  qwen
1

image-20240523115017945

使用ollama 运行 qwen CPU占用率为 300%,内存 40%,回答一个问题基本上要等很久。

image-20240523110842704

ollama官方的模型仓库参见这里:https://ollama.com/library

阿里巴巴的大模型:
ollama run  qwen
ollama run qwen:14b
ollama run qwen:32b
ollama run qwen:72b
ollama run qwen:110b   # 110b 表示该模型包含了 1100 亿(110 billion)个参数


脸书大模型:
ollama run llama2
ollama run llama3
ollama run llama3:8b

谷歌的大模型:
ollama run gemma

微软的大模型
ollama run phi3

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

# 删除模型

显示所有模型
# ollama list

删除模型
# ollama rm llama3:latest
1
2
3
4
5

结论:可以安装ollama和使用大模型,但是无法流畅的运行。

# 安装Tiny_Llama ManualReset模型

Tiny_Llama ManualReset 的 gitee地址: https://gitee.com/wan-zutao/tiny-llama-manual-reset

# 1.克隆仓库

1.使用root用户登录环境,clone当前仓到空闲目录

$ sudo -i
# git clone https://gitee.com/wan-zutao/tiny-llama-manual-reset.git tiny_llama
# cd tiny_llama/inference
1
2
3

# 2.运行download.sh

下载model,tokenizer文件。

# bash download.sh
1

image-20240523140020787

# 3.启动程序

python3 main.py
1

image-20240523140220661

用浏览器访问: IP+端口 http://127.0.0.1:5000

提一个问题:

image-20240523142743646

log会有响应的日志:

image-20240523142824732

再用top看看负载,CPU占用10%内存,占用9.5%,基本还能运行。

image-20240523140501864

# 安装宝塔面板

宝塔面板(BT Panel)是一款服务器管理软件,支持Linux系统,可以通过Web端轻松管理服务器,提升运维效率。它集成了建站、运维、安全等功能,可以帮助用户轻松管理服务器,降低运维难度。

搭建宝塔面板

进入宝塔官网 https://www.bt.cn/new/download.html

选择适合的系统脚本

image-20240523152412114

# 运行安装脚本

# wget -O install.sh https://download.bt.cn/install/install-ubuntu_6.0.sh && sudo bash install.sh ed8484bec
经过安装
Command may disrupt existing ssh connections. Proceed with operation (y|n)? Firewall is active and enabled on system startup
Default incoming policy changed to 'deny'
(be sure to update your rules accordingly)
Firewall reloaded
==================================================================
Congratulations! Installed successfully!
========================面板账户登录信息==========================

 外网面板地址: https://14.155.32.234:33161/f91c950f
 内网面板地址: https://192.168.1.22:33161/f91c950f
 username: XXX
 password: XXX
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

用浏览器打开

image-20240523154448933

同意协议之后,安装宝塔套件

image-20240523154630259

安装完成

image-20240523160730765

宝塔的命令行

(base) root@orangepiaipro:~# bt
==================================宝塔面板命令行====================================
(1) 重启面板服务                  (8) 改面板端口                                   |
(2) 停止面板服务                  (9) 清除面板缓存                                 |
(3) 启动面板服务                  (10) 清除登录限制                                |
(4) 重载面板服务                  (11) 设置是否开启IP + User-Agent验证             |
(5) 修改面板密码                  (12) 取消域名绑定限制                            |
(6) 修改面板用户名                (13) 取消IP访问限制                              |
(7) 强制修改MySQL密码             (14) 查看面板默认信息                            |
(22) 显示面板错误日志             (15) 清理系统垃圾                                |
(23) 关闭BasicAuth认证            (16) 修复面板(检查错误并更新面板文件到最新版)    |
(24) 关闭动态口令认证             (17) 设置日志切割是否压缩                        |
(25) 设置是否保存文件历史副本     (18) 设置是否自动备份面板                        |
(26) 关闭面板ssl                  (19) 关闭面板登录地区限制                        |
(28) 修改面板安全入口             (29) 取消访问设备验证                            |
(0) 取消                                                                           |
====================================================================================
请输入命令编号:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

# 安装wordpress站点

进入宝塔,点击软件商店--->一键部署

我这里选择wordpress

image-20240523172942530

使用 www.wp.com 搭建,这个域名在测试环境可以绑定hosts

image-20240523173156438

点击“提交”会报错,

# 解决报错undefined symbol: lua_getexdata

应该是nginx编译 Lua 版本不arm的

/www/server/nginx/sbin/nginx: symbol lookup error: /www/server/nginx/sbin/nginx: undefined symbol: lua_getexdata
1

切换nginx版本

点击网站--->nginx --->切换版本

把安装的1.24的nginx改成 1.23

image-20240523182921362

image-20240523182751048

nginx -t
nginx: [emerg] unknown directive "lua_package_path" in /www/server/nginx/conf/nginx.conf:28
nginx: configuration file /www/server/nginx/conf/nginx.conf test failed

1
2
3
4

修改配置

image-20240523183101513

# 再次安装wordpress站点

image-20240523183659031

image-20240523183709966

绑定hosts访问

192.168.1.22 www.testwp.com
1

使用浏览器访问安装wordpress系统

image-20240523183818003

输入数据库和数据库用户名密码等

image-20240523183915418

填写站点信息:

image-20240523184017922

安装完成,这样就可以用宝塔工具搭建各种的WEB站点了。

当然还可以用宝塔的图形界面使用Docker搭建各种的服务,对于哪些没有代码能力的人也是一种很友好的。

# 结语

本文只是介绍了用香橙派AIpro部署大语言模型和安装宝塔搭建web环境。

香橙派AIpro 支持Ubuntu、openEuler等操作系统,也可以作为一个学习Linux的有力工具。也能够满足大多数AI算法原型验证、推理应用开发的需求。

也可以用于智能家居设备的控制和管理,等等香橙派AIpro还有很多的玩法。

如果你有这样的小玩意你会做什么呢?