当前位置: 首页 > news >正文

全国网站备案wordpress 主题制作视频

全国网站备案,wordpress 主题制作视频,wap网站的好处,wordpress眉顶布局文章目录 1. 简介2. Kubernetes 安装3. OS配置4. Docker Engine#xff0c;cri-dockerd安装5. 安装 kubeadm6. GPU-Operator安装 1. 简介 Kubernetes通过设备插件框架提供对特殊硬件资源的访问#xff0c;如NVIDIA GPU、⽹卡、Infiniband适配器和其他设备。但是#xff0c;… 文章目录 1. 简介2. Kubernetes 安装3. OS配置4. Docker Enginecri-dockerd安装5. 安装 kubeadm6. GPU-Operator安装 1. 简介 Kubernetes通过设备插件框架提供对特殊硬件资源的访问如NVIDIA GPU、⽹卡、Infiniband适配器和其他设备。但是配置和管理带有这些硬件资源的节点需要配置多个软件组件例如驱动程序、容器运⾏时或其他库这些组件组合起来⽐较困难且容易出错。GPU Operator相关架构如下 可以从架构上看到NVIDIA GPU Operator使⽤Kubernetes中的Operator框架⾃动管理提供GPU所需的所有NVIDIA软件组件。这些组件包括NVIDIA驱动程序(启⽤CUDA)⽤于GPU的Kubernetes设备插件NVIDIA容器⼯具包使⽤GFD的⾃动节点标记基于DCGM的监控等。NVIDIA官⽅的GPU Operator可以很⽅便的安装配置组合为容器应⽤使⽤GPU提供了很⼤的便 利性。⽬前最新的版本是23.9.0⽀持的相关平台如下 Deployment OptionsBare MetalVirtual machines with GPU PassthroughVirtual machines with NVIDIA vGPU based products HypervisorsVMware vSphere 7 and 8Red Hat Enterprise Linux KVMRed Hat Virtualization (RHV) Operating SystemKubernetesRed Hat OpenShiftVMWare vSphere with TanzuRancher Kubernetes Engine 2HPE Ezmeral Runtime EnterpriseCan MicUbuntu20.04 LTS1.25—1.287.0 U3c,8.0 U21.25—1.28Ubuntu22.04 LTS1.25—1.281.26CentOS 71.25—1.28Red Hat Core OS4.9—4.14Red Hat Enterprise Linux 8.4,8.6, 8.7, 8.81.25—1.281.25—1.28Red Hat Enterprise Linux 8.4, 8.55.5 GPU Operator在如下组合上官⽅进⾏过验证: Operating SystemContainerd 1.4 - 1.7CRI-OUbuntu 20.04 LTSYesYesUbuntu 22.04 LTSYesYesCentOS 7YesNoRed Hat Core OS (RHCOS)NoYesRed Hat Enterprise Linux 8YesYes 2. Kubernetes 安装 从GPU Operator⽀持列表上看Kubernetes最低版本为1.25。对于OS的⽀持上看起来对Ubuntu和RHEL⽀持⽐较好。另外Dockershim已经从Kubernetes 1.24版中移除。因此如果Container Runtime选择Deocker Engine那么需要额外cri-dockerd进⾏配合使⽤。这⾥我们选择如下平台进⾏相关的安装配置。 硬件平台 浪潮 NF5468M5 Intel® Xeon® Gold 6240R CPU 2.40GHzNVIDIA A30GA100GLGPU 软件平台 VMware ESXi, 8.0.1, 21495797Ubuntu 22.04 LTSDocker Engine 24.0.7cri-dockerd 0.3.7 本次测试总共2个Kubernetes节点1个管理节点1个⼯作节点。 hostnameIP Addressk8sm172.16.81.103k8s01172.16.81.104 3. OS配置 禁⽌swap加载相关内核模块设置相关内核参数 sudo swapoff -a sudo sed -i / swap / s/^\(.*\)$/#\1/g /etc/fstab sudo tee /etc/modules-load.d/containerd.conf EOF overlay br_netfilter EOF sudo modprobe overlay sudo modprobe br_netfilter sudo tee /etc/sysctl.d/kubernetes.conf EOF net.bridge.bridge-nf-call-ip6tables 1 net.bridge.bridge-nf-call-iptables 1 net.ipv4.ip_forward 1 EOF sudo sysctl --system4. Docker Enginecri-dockerd安装 # Add Dockers official GPG key: sudo apt update sudo apt install ca-certificates curl gnupg sudo install -m 0755 -d /etc/apt/keyrings curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg -- dearmor -o /etc/apt/keyrings/docker.gpg sudo chmod ar /etc/apt/keyrings/docker.gpg # Add the repository to Apt sources: echo \ deb [arch$(dpkg --print-architecture) signedby/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu \ $(. /etc/os-release echo $VERSION_CODENAME) stable | \ sudo tee /etc/apt/sources.list.d/docker.list /dev/null sudo apt update sudo apt install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugicri-dockerd可以从github上直接下载deb包进⾏安装 wget https://github.com/Mirantis/cri-dockerd/releases/download/v0.3.7/cridockerd_0.3.7.3-0.ubuntu-jammy_amd64.deb sudo dpkg -i cri-dockerd_0.3.7.3-0.ubuntu-jammy_amd64.deb注意cri-dockerd默认会从google去拉取pause镜像因此需要将cri-dockerd的默认镜像拉取url改掉否则在初始化Kubernetes安装的时候会因为拉取不到pause镜像⽽失败。 cri-dockerd安装完成后修改cri-docker.service⽂件修改如下⾏ ExecStart/usr/bin/cri-dockerd --container-runtime-endpoint fd://改为如下 ExecStart/usr/bin/cri-dockerd --container-runtime-endpoint fd:// --podinfra-container-image registry.aliyuncs.com/google_containers/pause:3.9重新加载systemd dameon sudo systemctl daemon-reload启动docker、cr-dockerd服务并将其设置为⾃动启动 sudo systemctl start docker sudo systemctl start cri-docker sudo systemctl enable docker cri-docker5. 安装 kubeadm 我们从国内阿⾥云软件仓库安装kubeadm⾸先添加安装源 sudo wget https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg -O /etc/apt/keyrings/kubernetes.gpg echo \ deb [archamd64 signed-by/etc/apt/keyrings/kubernetes.gpg] https://mirrors.aliyun.com/kubernetes/apt/ \ kubernetes-xenial main | \ sudo tee /etc/apt/sources.list.d/kubernetes.list /dev/null sudo apt update注意请按照上述指令配置kubeadm安装源不要按照阿⾥云Kubernetes软件仓库的指导进 ⾏软件源的配置 安装kubeadm、kubelet、kubectl这⾥我们没有安装最新版本的Kubernetes安装的是1.26.9-00这个版本 sudo apt install -y kubelet1.26.9-00 kubeadm1.26.9-00 kubectl1.26.9-00初始化安装Kubernetes管理节点,由于在系统中存在2个容器引擎因此在安装Kubernetes的时候需要指定相关的cri-socket。这⾥不要指定为Docker Engine的socket需要使⽤cri-docker的socket。同时我们指定Kubernetes的镜像从国内阿⾥云仓库拉取。 sudo kubeadm init --image-repository registry.aliyuncs.com/google_containers --pod-network-cidr10.244.0.0/16 --apiserver-advertise-address172.16.81.103 --cri-socket unix:///var/run/cridockerd.sock添加Work节点 Kubernetes管理节点安装完成后按照相关提示将Work节点加⼊群集 sudo kubeadm join 172.16.81.103:6443 --token fh1lte.m80w04ebcmd1ryg4 --discovery-token-ca-cert-hash sha256:5757a76b34ac07a236ad01f8601d4f4f41c82e257a48ddf14620e7b950088793 --cri-socket unix:///var/run/cri-dockerd.sock注意要加上–cri-socket参数 安装CNI插件 这⾥我们使⽤Antrea CNI插件下载相关yaml⽂件直接在Kubernets上应⽤即可。 kubectl apply -f https://github.com/antreaio/antrea/releases/download/1.14.1/antrea.yml6. GPU-Operator安装 本次使⽤直通⽅式将GPU给Kubernetes的Work节点使⽤。使⽤直通模式在ESXi上不⽤安装NVIDIA的驱动。另外在安装GPU Operator的时候对于GPU驱动也有2种选择驱动安装在OS中驱动直接装在容器中这2种⽅式都可以。这⾥我们选择将驱动安装到容器中的⽅式进⾏因此OS中也不⽤安装NVIDIA驱动。 . 配置GPU直通 将直通的GPU分给相关的VM ⾸先确保VM是使⽤的EFI模式 修改VM的⾼级参数配置 添加如下2个参数 pciPassthru.use64bitMMIOTRUE pciPassthru.64bitMMIOSizeGB 64pciPassthru.64bitMMIOSizeGB参数的值可以参考nvidia的⽹站 https://docs.nvidia.com/ai-enterprise/latest/release-notes/index.html#tesla-p40-largememory-vms 安装GPU Operator GPU Operator通过helm chart安装因此先安装⼀下helm并将相关的helm仓库添加好 #安装helm curl -fsSL -o get_helm.sh https://raw.githubusercontent.com/helm/helm/master/scripts/get-helm-3 \chmod 700 get_helm.sh \./get_helm.sh #添加helm仓库 helm repo add nvidia https://helm.ngc.nvidia.com/nvidia \helm repo update默认情况下GPU Operator会将相关组件部署在集群中所有带有GPU的⼯作节点上。GPU⼯作节点通过标签 feature.node.kubernetes.io/pci-10de.presenttrue 来识别带有GPU的⼯作节点。我们先将有GPU的⼯作节点打上标签。 注意pci-10de⾥的0x10de是NVIDIA的PCI vendor ID这个可以在配置直通的界⾯⾥可以 看到 kubectl label nodes k8s01 feature.node.kubernetes.io/pci-10de.presenttrue通过helm安装GPU Operator helm install --wait --generate-name -n gpu-operator --create-namespace nvidia/gpu-operator如果NVIDIA的驱动已经在OS上安装了那么可以选择helm安装时不要将驱动安装到容器⾥使⽤如下参数安装 helm install --wait --generate-name -n gpu-operator --create-namespace nvidia/gpu-operator --set driver.enabledfalse可以通过kubectl监控安装过程安装完成后如果没有问题会有如下相关pod⽣成 $ kubectl get pods -n gpu-operator NAME READY STATUS RESTARTS AGE gpu-feature-discovery-crrsq 1/1 Running 0 60s gpu-operator-7fb75556c7-x8spj 1/1 Running 0 5m13s gpu-operator-node-feature-discovery-master-58d884d5cc-w7q7b 1/1 Running 0 5m13s gpu-operator-node-feature-discovery-worker-6rht2 1/1 Running 0 5m13s gpu-operator-node-feature-discovery-worker-9r8js 1/1 Running 0 5m13s nvidia-container-toolkit-daemonset-lhgqf 1/1 Running 0 4m53s nvidia-cuda-validator-rhvbb 0/1 Completed 0 54s nvidia-dcgm-5jqzg 1/1 Running 0 60s nvidia-dcgm-exporter-h964h 1/1 Running 0 60s nvidia-device-plugin-daemonset-d9ntc 1/1 Running 0 60s nvidia-device-plugin-validator-cm2fd 0/1 Completed 0 48s nvidia-driver-daemonset-5xj6g 1/1 Running 0 4m53s nvidia-mig-manager-89z9b 1/1 Running 0 4m53s nvidia-operator-validator-bwx99 1/1 Running 0 58s如果有什么问题可以通过kubectl logs检查pod的⽇志。 验证GPU Operator 创建 cuda-vectoradd.yaml 内容如下 apiVersion: v1 kind: Pod metadata:name: cuda-vectoradd spec:restartPolicy: OnFailurecontainers:- name: cuda-vectoraddimage: nvcr.io/nvidia/k8s/cuda-sample:vectoradd-cuda11.7.1-ubuntu20.04resources:limits:nvidia.com/gpu: 1运⾏pod并查看相关⽇志⽇志类似如下表示测试成功 kubectl apply -f cuda-vectoradd.yaml kubectl logs pod/cuda-vectoradd [Vector addition of 50000 elements] Copy input data from the host memory to the CUDA device CUDA kernel launch with 196 blocks of 256 threads Copy output data from the CUDA device to the host memory Test PASSED DoneGPU的分配可以通过如下命令查看 $ kubectl describe node k8s01 .......... .......... (Total limits may be over 100 percent, i.e., overcommitted.) Resource Requests Limits -------- -------- ------ cpu 400m (5%) 0 (0%) memory 0 (0%) 0 (0%) ephemeral-storage 0 (0%) 0 (0%) hugepages-1Gi 0 (0%) 0 (0%) hugepages-2Mi 0 (0%) 0 (0%) nvidia.com/gpu 1 1 Events: none这⾥nvdia.com/gpu可以看到这个节点上的1个GPU已经分配出去 参考⽹站 阿⾥云Kubernetes安装源 https://developer.aliyun.com/mirror/kubernetes?spma2c6h.13651102.0.0.1c801b115pcCkLDocker Engine安装 https://docs.docker.com/engine/install/ubuntu/GPU Operator⽂档 https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/latest/getting-started.html#GPU直通配置⽂档 https://blogs.vmware.com/apps/2018/09/using-gpus-with-virtual-machines-on-vsphere-part-2- vmdirectpath-i-o.html
http://www.huolong8.cn/news/254187/

相关文章:

  • 常州网站建设怎么样网页设计实训报告1500
  • 学校html网站模板代码一级a做爰片免费网站 小说
  • 辽宁省水利建设市场信用信息平台网站网站策划专员所需知识
  • 网站开发需求大厅上海自建站招聘
  • 基于mvc的网站开发免费建设个人网站
  • html网页爱心代码湖南seo优化排名
  • 网站强制qq弹窗代码discuz绿色带门户手机网站模板
  • 用插件做的炫酷网站wordpress轮播图大小怎么修改
  • 安徽中兴建设工程有限公司网站上海网络营销推广服务
  • 帝国做网站怎么加视频网站开发结构
  • 做网站要会写代码吗网络规划设计师书籍
  • 网站建设+太原西安整站优化
  • 处方药可以做网站宣传吗赣州网站推广多少钱
  • 六站合一的应用场景做细分行业信息网站
  • 昌吉建设网站网站流量分析的指标有哪些
  • 做公司永久免费网站什么好做游戏的php网站有哪些
  • 射阳做网站公司网络服务包括哪些内容
  • 华为网站搭建家装设计网站开发
  • 网站开发费计入什么科目网站内部服务器错误
  • 青海报社网站建设公司wordpress 写作
  • 网页制作淘宝网站建设怎样取消网站备案
  • 网站建设回访网站开发seo规范
  • 休闲度假村网站建设方案WordPress速度优化2019
  • 番禺制作网站企业深圳网站制作 公司
  • 制作微信公众号的网站开发使用oss图片做网站
  • 网站整站程序哪里网站用vue.js做的
  • dede 网站标题住房和城乡建设部政务服务平台
  • 免费的个人简历模板网站网站建设价格是哪些方面决定的
  • 网站建设需要什么学院网站建设投标
  • 如何注册国外网站网站被k恢复