RTSP推拉流服务搭建

2024-03-07 流媒体

一、基础服务搭建（windows）

1.下载RTSP服务器

下载链接：https://github.com/aler9/rtsp-simple-server/releases

2.下载FFmpeg工具

下载链接：https://github.com/BtbN/FFmpeg-Builds/releases

3.启动服务器

进入RTSP服务器路径，控制台执行.\mediamtx.exe

yolov8-pose：关键点姿态检测

2024-01-30 关键点检测

环境&安装

同上文yolov8：火灾检测

模型使用yolov8n-pose

数据标注

标注工具：labelme

对图像中的目标（人物）及其关键点进行标记，包括1个目标类别和17个关键点类别

数据格式转换

将labelme数据格式转为yolo格式，通用转换代码：

1
2
3

# TODO:
# 参考yolov8-火灾检测，未完待续
...

创建训练yaml文件

参考yolov8n-pose.yaml

train: /exp/work/video/yolov8/datasets/human-pose/images/train #训练集文件夹
val: /exp/work/video/yolov8/datasets/human-pose/images/val # 验证集文件夹
test: /exp/work/video/yolov8/datasets/human-pose/images/val # 测试集文件夹
nc: 1 # 分类数

# 关键点，每个关键点有 X Y 是否可见 三个参数
# 可见性：2-可见不遮挡 1-遮挡 0-没有点
kpt_shape: [17, 3]

# 框的类别（对于关键点检测，只有一类）
names:
  0: people

yolov8-火灾检测

2024-01-25 目标检测

环境

GPU

NVIDIA 3090*2
显卡驱动 535.104.05
CUDA版本 12.2
CUDAtoolkit (cuda_12.2.2_535.104.05_linux)
cuDNN (v8.9.7)

yolo版本

v8.1.5 (ultralytics yolov8)

pytorch版本

v2.1.2

python环境

CentOS7.9
anaconda3
python3.9

安装

源码主页：https://github.com/ultralytics/ultralytics

官方文档：https://docs.ultralytics.com/zh

克隆源码

1	git clone https://hub.nuaa.cf/ultralytics/ultralytics.git

安装依赖

1	pip install pip install ultralytics -i https://mirror.baidu.com/pypi/simple

环境验证

python

1 2	import ultralytics ultralytics.checks()

cli

1	yolo predict model=yolov8n.pt source=ultralytics/assets/zidane.jpg

执行完毕后得到输出的结果如下：

(py39_yolov8) [root@jdz yolov8]# yolo predict model=yolov8n.pt source=ultralytics/assets/zidane.jpg 
Ultralytics YOLOv8.1.5 🚀 Python-3.9.18 torch-2.1.2+cu121 CUDA:0 (NVIDIA GeForce RTX 3090, 24260MiB)
YOLOv8n summary (fused): 168 layers, 3151904 parameters, 0 gradients, 8.7 GFLOPs

image 1/1 /exp/work/video/yolov8/ultralytics/assets/zidane.jpg: 384x640 2 persons, 1 tie, 216.9ms
Speed: 7.3ms preprocess, 216.9ms inference, 762.4ms postprocess per image at shape (1, 3, 384, 640)
Results saved to runs/detect/predict
💡 Learn more at https://docs.ultralytics.com/modes/predict

将在Results saved to runs/detect/predict目录下找到输出结果

NetworkX: 图论算法应用

2024-01-08 NetworkX

NetworkX

NetworkX是一款Python的软件包，用于创造、操作复杂网络，以及学习复杂网络的结构、动力学及其功能。有了NetworkX就可以用标准或者不标准的数据格式加载或者存储网络，它可以产生许多种类的随机网络或经典网络，也可以分析网络结构、建立网络模型、设计新的网络算法、绘制网络等

参考文献地址: https://www.osgeo.cn/networkx/reference/index.html

图计算应用方式比较

1.nebula + spark

依赖nebula-spark-connector包、nebula-algorithm包和spark集群的数据读取、图计算方式

2.clickhouse + NetworkX

由于nebula-algorithm依赖spark集群，且nebula-console原生的数据读取能力不佳，在环境受限且计算量有限的情况下优先考虑跳过spark集群和nebula图库，采用clickhouse + NetworkX的图计算方式，其中clickhouse是存储了nebula源数据的列式分布式表，作用类似于方法1中将nebula集群数据通过nebula-spark-connector包导入为spark-DataFrame，仅用做数据读取，再通过将数据转化为NetworkX的图结构进行图计算

基于VGG16神经网络实现以图搜图

2024-01-02 深度学习

思路

· 预先准备一份图片库，并对其中数据进行批处理操作，使用VGG16卷积神经网络提取图像的512维卷积特征，刷入数据库（ClickHouse）记录；

· 上传目标图像进行识图，同样使用VGG16提取目标图像特征，使用CK数据库距离函数进行匹配，高于阈值即可返回识图结果

神经网络

# -*- coding: utf-8 -*-
# @Author : tianL.R
# @Email : rtl1312@163.com
# @Time : 2023.11.26
import time

import numpy as np
from PIL import Image
from keras.applications.vgg16 import VGG16
from keras.applications.vgg16 import preprocess_input
from keras.preprocessing import image
from numpy import linalg


class VGG16Net:
    def __init__(self):
        self.input_shape = (224, 224, 3)
        self.weight = 'imagenet'
        self.pooling = 'max'
        self.model_vgg = VGG16(weights=self.weight,
                               input_shape=(self.input_shape[0], self.input_shape[1], self.input_shape[2],),
                               pooling=self.pooling,
                               include_top=False)
        self.model_vgg.predict(np.zeros((1, 224, 224, 3)))

    def detection(self, img_path):
        """
        提取VGG16最后一层卷积特征
        """
        # img = image.load_img(img_path, target_size=(self.input_shape[0], self.input_shape[1]))
        img = img_path.resize((self.input_shape[0], self.input_shape[1]))
        img = image.img_to_array(img)
        img = np.expand_dims(img, axis=0)
        img = preprocess_input(img)
        feat = self.model_vgg.predict(img)
        norm_feat = feat[0] / linalg.norm(feat[0])
        return norm_feat.tolist()


if __name__ == '__main__':
    img1 = '333.jpg'
    img2 = '555.jpg'
    img1 = Image.open(img1)
    img2 = Image.open(img2)

    vgg = VGG16Net()
    queryVec1 = np.array(vgg.detection(img1))
    queryVec2 = np.array(vgg.detection(img2))
    scores = np.dot(queryVec1, queryVec2)
    score2 = queryVec1.dot(queryVec2) / (np.linalg.norm(queryVec1) * np.linalg.norm(queryVec2))
    print(scores)
    print(score2)

卷积神经网络图像分类算法小集

2024-01-01 深度学习

目录结构

训练结构

· 在项目根目录下新建数据集文件夹data_set，建立子文件夹（数据集名称）用于存放训练集和测试集；

· 在项目根目录下新建数据集文件夹class_j，用于存放分类json文件；

· 在项目根目录下新建数据集文件夹models，用于存放训练好的模型文件；

· 神经网络model.py；

· 训练脚本train.py；

· 预测脚本predict.py

# project
├── data_set
│	├── data
│	     ├── train
│	     │    ├── 00001.jpg
│	     │    ├── 00002.jpg
│	     │    ├── 00003.jpg
│	     │    ├── ...
│	     │    └── 10000.jpg
│	     └── val
│	          ├── 00001.jpg
│	          ├── 00002.jpg
│	          ├── 00003.jpg
│	          ├── ...
│	          └── 01000.jpg
├── class_j
│	├── class_indices.json
├── models
│	├── model.pth
├── model.py
├── train.py
└── predict.py

封装结构

以GoogLeNet神经网络为例：

# GoogLeNet
├── class_j
│	├── class_indices.json
│── weights
│	├── GoogLeNet_GPU_v1.pth
└── model.py

CentOS-LibreOffice工具包安装

2023-12-28 Linux

· 系统： CentOS7

· LibreOffice： 7.4.5.1 稳定版

资源下载

· 官方网站： https://zh-cn.libreoffice.org/download/libreoffice/

· 下载地址：https://downloadarchive.documentfoundation.org/libreoffice/old/7.4.5.1/rpm/x86_64/

选择LibreOffice_7.4.5.1_Linux_x86-64_rpm.tar.gz安装包和LibreOffice_7.4.5.1_Linux_x86-64_rpm_langpack_zh-CN.tar.gz中文语言包并下载

安装

进入安装包下载目录进行解压，这里为/usr/local/

1
2
3

cd /usr/local/   进入目录
tar -zxvf LibreOffice_7.4.6.1_Linux_x86-64_rpm.tar.gz   解压libreoffice
tar -zxvf LibreOffice7.4.6.1_Linux_x86-64_rpm_langpack_zh-CN.tar.gz   解压中文语言包

安装libreoffice和语言包的rpm包，默认安装目录为/opt/libreoffice7.4

cd /usr/local/LibreOffice_7.4.6.1_Linux_x86-64_rpm/RPMS/
yum -y install *.rpm
cd /usr/local/LibreOffice_7.4.6.1_Linux_x86-64_rpm_langpack_zh-CN/RPMS
yum -y install *.rpm

安装soffice，进入/opt/libreoffice7.4/program目录执行

cd /opt/libreoffice7.4/program/
yum install cairo 
yum install cups-libs
yum install libSM

检查

1	/opt/libreoffice7.4/program/soffice -help

正常输出，安装成功，接下来将soffice添加到环境变量

1	vim /etc/profile

1
2
3

# libreoffice
export LibreOffice_PATH=/opt/libreoffice7.4/program
export PATH=$LibreOffice_PATH:$PATH

1	source /etc/profile

LangChain + ChatGLM2-6B的本地知识问答库

2023-10-24 GPT

原项目Github：https://github.com/imClumsyPanda/langchain-ChatGLM

项目部署

· v 0.2.6

机器配置：

· python 环境：anaconda3 + python3.10.12

· GPU：RTX3090*2 + CUDA11.7

· torch：2.0.1（CUDA未升至12）

· conda：py310_dtglm

模型下载

· m3e https://huggingface.co/moka-ai/m3e-base/tree/main

· chatglm2-6b https://huggingface.co/THUDM/chatglm2-6b/tree/main

chatglm清华源 https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2F&mode=list

(这里将模型全部下载至/root/huggingface下)

创建虚拟环境，安装依赖

conda create -n py310_dtglm python=3.10.12
conda activate py310_dtglm

pip install --use-pep517 -r requirements.txt -i https://mirror.baidu.com/pypi/simple
pip install --use-pep517 -r requirements_api.txt -i https://mirror.baidu.com/pypi/simple
pip install --use-pep517 -r requirements_webui.txt -i https://mirror.baidu.com/pypi/simple

修改配置、模型路径

复制配置文件

1	python copy_config_example.py

修改配置文件

· model_config.py

MODEL_ROOT_PATH = "/root/huggingface"

MODEL_PATH = {
    "embed_model": {
		...
        "m3e-base": "/root/huggingface/m3e-base", # 修改m3e模型路径
		...
    },
    # TODO: add all supported llm models
    "llm_model": {
		...
        "chatglm2-6b": "/root/huggingface/chatglm2-6b", # 修改chatglm2-6b模型路径
		...
    },
}

EMBEDDING_MODEL = "m3e-base" # 可以尝试最新的嵌入式sota模型：bge-large-zh-v1.5
LLM_MODEL = "chatglm2-6b"

Nebula3集群版新旧版本多开

2023-09-28 BigData

· 系统：CentOS7 · 已有nebula版本：2.6.1（开源社区版） · 已有nebula-console版本：2.6.0 · 已有nebula-graph-studio版本：3.2.3 · 多开nebula版本：3.6.0（开源社区版） · 多开nebula-graph-studio版本：3.2.3 · 多开nebula-console版本：3.6.0

集群部署

· 参考单机部署方式，对配置文件--meta_server_addrs做扩展，添加meta机器

· 区分2.6.1版本已被占用的端口，找到配置文件默认的9559、19559、9669、19669、9779、19779端口，修改为8559、18559、8669、18669、8779、18779

· 启动集群

· 配置nebula-graph-studio默认端口为7002

· 注：双开nebula后使用同版本nebula-graph-studio即使更换了端口，也不能同时运行，可以安装nebula-console来同时启动nebula控制台

chmod 111 nebula-console

./nebula-console --addr <host> --port 9669 -u root -p nebula

./nebula-console --addr <host> --port 8669 -u root -p nebula

Nebula3单机版快速安装

2023-09-27 BigData

· 系统：CentOS7 · nebula版本：3.6.0（开源社区版） · nebula-graph-studio版本：3.2.3

单机部署

tar包源码下载

wget https://oss-cdn.nebula-graph.com.cn/package/3.6.0/nebula-graph-3.6.0.el7.x86_64.tar.gz

解压并重命名

tar -xvzf nebula-graph-3.6.0.el7.x86_64.tar.gz

mv nebula-graph-3.6.0.el7.x86_64 nebula

修改配置文件

cd nebula/etc

mv nebula-graphd.conf.default nebula-graphd.conf

mv nebula-metad.conf.default nebula-metad.conf

mv nebula-storaged.conf.default nebula-storaged.conf

修改对应文件存储位置、节点ip地址，集群同理