ChinaFFmpeg

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 14851|回复: 7

[Linux] ffmpeg中是怎么使用NV 的CUDA进行编码的

[复制链接]
发表于 2016-6-1 18:49:06 | 显示全部楼层 |阅读模式
ffmpeg中是怎么使用NV 的CUDA进行编码的
回复

使用道具 举报

发表于 2016-6-6 13:32:42 | 显示全部楼层
nvidia有NvENC,不过使用的encoder
https://developer.nvidia.com/nvidia-video-codec-sdk

在编译ffmpeg的时候configure配置时需要开启
  --enable-nvenc           enable NVIDIA NVENC support [no]

回复 支持 反对

使用道具 举报

发表于 2016-6-6 13:34:06 | 显示全部楼层
下面是记录的笔记,安装SDK后需要确认一些信息

  1. nvidia-smi  -a 查看GPU状态命令

  2. /root/NVIDIA_CUDA-7.0_Samples/bin/x86_64/linux/release 这个下面有一系列的GPU的测试工具,可以使用
  3. 查看
  4. [root@localhost release]# ./deviceQuery
  5. ./deviceQuery Starting...

  6. CUDA Device Query (Runtime API) version (CUDART static linking)

  7. Detected 1 CUDA Capable device(s)

  8. Device 0: "Tesla K20c"
  9.   CUDA Driver Version / Runtime Version          7.0 / 7.0
  10.   CUDA Capability Major/Minor version number:    3.5
  11.   Total amount of global memory:                 4800 MBytes (5032706048 bytes)
  12.   (13) Multiprocessors, (192) CUDA Cores/MP:     2496 CUDA Cores
  13.   GPU Max Clock rate:                            706 MHz (0.71 GHz)
  14.   Memory Clock rate:                             2600 Mhz
  15.   Memory Bus Width:                              320-bit
  16.   L2 Cache Size:                                 1310720 bytes
  17.   Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
  18.   Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
  19.   Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
  20.   Total amount of constant memory:               65536 bytes
  21.   Total amount of shared memory per block:       49152 bytes
  22.   Total number of registers available per block: 65536
  23.   Warp size:                                     32
  24.   Maximum number of threads per multiprocessor:  2048
  25.   Maximum number of threads per block:           1024
  26.   Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  27.   Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  28.   Maximum memory pitch:                          2147483647 bytes
  29.   Texture alignment:                             512 bytes
  30.   Concurrent copy and kernel execution:          Yes with 2 copy engine(s)
  31.   Run time limit on kernels:                     No
  32.   Integrated GPU sharing Host Memory:            No
  33.   Support host page-locked memory mapping:       Yes
  34.   Alignment requirement for Surfaces:            Yes
  35.   Device has ECC support:                        Enabled
  36.   Device supports Unified Addressing (UVA):      Yes
  37.   Device PCI Domain ID / Bus ID / location ID:   0 / 4 / 0
  38.   Compute Mode:
  39.      < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

  40. deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 7.0, CUDA Runtime Version = 7.0, NumDevs = 1, Device0 = Tesla K20c
  41. Result = PASS
复制代码
回复 支持 反对

使用道具 举报

发表于 2016-6-6 13:35:51 | 显示全部楼层
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-13 15:21:07 | 显示全部楼层
大师兄 这个nvenc搞出来了  但是我用的是GTX TITANX 这个显卡,每个系统限制2路转码,这个是不能接受的,现在准备改成cuda并行计算进行加速,你有没有什么资料?谢谢大师兄
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-13 15:21:49 | 显示全部楼层
好牛逼的显卡
回复 支持 反对

使用道具 举报

发表于 2016-6-13 16:59:08 | 显示全部楼层

现在看懂了?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-13 18:33:32 | 显示全部楼层
知道cuda怎么用了!但是要把实现cuda加速x265的编码,我还需要走很长的路
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|Archiver|ChinaFFmpeg

GMT+8, 2024-12-27 13:36 , Processed in 0.059501 second(s), 14 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表