夜莺监控系统部署

1.配置环境

操作系统:linux-ubuntu x86_64

夜莺版本:V7.7.7

时序数据库:victoria-metrics-V1.113.0

categraf:V0.4.3

2.安装依赖包

sudo apt update

sudo apt install mariadb-server

sudo systemctl enable mariadb

sudo systemctl restart mariadb

mysql -e \"SET PASSWORD FOR \'root\'@\'localhost\' = PASSWORD(\'1234\');\"

这里为了方便root密码用1234展示

sudo apt install redis

sudo systemctl enable redis

sudo systemctl restart redis

3.部署夜莺

从github上下载想要的版本

https://github.com/ccfos/nightingale/releases

解压到对应的目录里面

tar -zxvf n9e-v7.7.1-linux-amd64.tar.gz -C nightingale/

解压后会有一个n9e.sql数据库,导入数据库表结构

mysql -uroot -p1234 < n9e.sql

etc/config.toml文件关键参数配置

[DB]

# postgres: host=%s port=%s user=%s dbname=%s password=%s sslmode=%s

# postgres: DSN=\"host=127.0.0.1 port=5432 user=root dbname=n9e_v6 password=1234 sslmode=disable\"

# sqlite: DSN=\"/path/to/filename.db\"

[DSN =]{.underline} \"root:1234@tcp(127.0.0.1:3306)/n9e_v6?charset=utf8mb4&parseTime=True&loc=Local&allowNativePasswords=true\"

# enable debug mode or not

[[Pushgw.Writers]]

# Url = \"http://127.0.0.1:8480/insert/0/prometheus/api/v1/write"

Url = \"http://127.0.0.1:8428/api/v1/write"

如果时序数据库用的是victoria-metrics则应该是

[[Pushgw.Writers]]

Url = \"http://127.0.0.1:8428/api/v1/write"

如果用的是prometheus应该是

[[Pushgw.Writers]]

Url = \"http://127.0.0.1:9090/api/v1/write"

[[Pushgw.Writers]] 这个部分是双中括号扩起来的,在 toml 配置中,表示数组,即 [[Pushgw.Writers]] 配置段可以有多个,这样夜莺接收到数据之后,就会把数据同时写到多个后端时序库。比如:

[[Pushgw.Writers]]

Url = \"http://127.0.0.1:9090/api/v1/write"

BasicAuthUser = \"\"

BasicAuthPass = \"\"

[[Pushgw.Writers]]

Url = \"http://127.0.0.1:8428/api/v1/write"

BasicAuthUser = \"\"

BasicAuthPass = \"\"

上例中就是配置了两个时序库。

4.配置时序数据库

https://github.com/VictoriaMetrics/VictoriaMetrics/releases/tag/v1.113.0

从这里下载对应的版本

-enterprise是企业版 -cluster是集群部署

下载后解压下来

tar-zxvf victoria-metrics-linux-amd64-v1.113.0.tar.gz -C vm/

直接用./victoria-metrics-prod 运行或者nohup ./victoria-metrics-prod &>vm.log & 默认监听8428端口

启动夜莺./n9e运行或者nohup ./n9e &> n9e.log &放在后台运行 默认监听是17000端口

访问夜莺入口,默认用户是root 密码是root.2020

在集成中心-数据源-新增-prometheus 添加数据源

关键在URL:http://IP:8428

添加后就可以在时序指标-即时查询查询到相应的指标数据

5.配置categraf

下载对应的版本

https://flashcat.cloud/download/categraf/

这里categraf的参数非常多,先上一个网站。后面回弄个使用手册。

https://flashcat.cloud/docs/content/flashcat-monitor/categraf/3-configuration/

在categraf的配置文件conf/config.toml下有两个地方需要修改成本地的dify地址

将这两个ip地址改成监控机的地址

通过./categraf 或者nohup ./categraf &> categraf.log &挂在后台运行

6.添加仪表盘

在仪表盘-监控仪表盘-业务组-DefaultbusiGroup-导入-导入内置仪表盘-linux 选择一个仪表盘

再次点击进去就可以看到数据看板和资源信息了。

7机器集群

点击基础设施-机器列表 只要categra配置文件中指向夜莺的地址那夜莺就能收集到机器的信息。

至此夜莺部署基本完成,后续功能还得继续摸索。