|
A. video(视频)部分:/ }1 K/ f0 Q8 T
本部分设定输出的视频码流的类型和参数,大部分参数在模版中已经固定。
: a' t+ t0 q* r1)基本类型:有mpeg1/mpeg2,mpeg1用于vcd, mpeg2用于svcd/dvd.
6 ~+ l5 ~/ R% g$ N# U2 ~; R2)大小:PAL vcd标准为352x288, pal svcd标准为480x576, pal dvd标准为720x576( x( F9 Z) C+ @$ W. `# S% f5 [5 G- F
3)画面宽高比:一般应该用4:3 625 line PAL, 这是电视机的屏幕比例. R( w; g: v% \2 ~& ^' s
4)桢率:pal 的标准为25fps
- b; i! g4 `8 \% X4 m6 ~5) 码率控制:码率控制算法是造成各种编码器编码效率和质量不同的关键因素。" b- S" D: q, @; X) m: G
mpeg标准中并没有对次算法7 ?2 {( c ` o: y
的具体实现做规定,这通常也是商业版本的知识产权内容。( L. A6 H3 [( Z* r& \
CBR, 固定码率:保持码率基本维持在平均码率。实现简单,对复杂场景会因码率不足造成马赛克现象,
* r5 A4 P# S: R* L) @' Y1 K对于7 r% h1 Y& h5 O
简单场景则不能充分利用编码空间。(这里讲的复杂场景是指细节/边缘丰富以及快速变化场景)。9 i: c t" k9 c
VBR, (2-pass VBR), “二次处理VBR”。,% q" b) Y* O2 C5 n$ L! W
认为其意思是通过对整个视频源进行2次处理使编码效率最高:: O/ x+ @4 [0 B3 ^
第一遍判断何处为复杂场景和简单场景,第二遍根据码率的上下限,把码率重新分配更多给复杂场景。
6 J4 i$ _$ h3 k, s9 B可以在实验中看出, tmpgenc在进行这种编码时进度指示在50%以前是没有预览图象的,: k2 F" S* v! P6 G. l" N9 o
而且桢进度指示为0。所以建议威龙改译为“二次处理”。
! D% C& W! z9 _7 x# ?这种码流控制方式应该在给定码率下得到最好的质量,但是和具体2 次分配算法关系很大。
+ g8 Y1 ]3 \6 H8 s0 P- }9 k同时耗时最长。一些其他编码器甚至有3次处理的码率优化。
) m* Y, O# u! ?) WMVBR (手动可变码率),设定最大码率和对不同的帧类型设定不同的信息损失量,实现局部码率优化。5 v" ]! {4 \3 T) y. K
可以通过手工指定复杂场景为I帧对之进行较精细的编码。参见对于GOP参数设定部分。. b, c8 \# V ~& @, C$ t
CQ-VBR (自动可变码率),设定主观质量值和码率上下限,以主观质量标准对编码器量化环节进行控制,
8 i Q3 V7 M j! D8 y' N( G5 K; ?在可 选参数中设定主观质量值以后,编码器就在能达到此质量标准的前提下尽量节省码率。
4 o$ X1 {9 @2 a4 E8 h+ E, T( ~4 s! H" D关键在于编码器对主观质
0 \! \4 U* I; L0 H2 s) A$ K4 ?- m量的评价方法。这是CQ和VBR的综合,也可以看作自动的MVBR。# G8 Z9 G4 Q- a: i; J# @% i. m1 c" d: E
威龙汉化5版 在可选参数中有一行是“不破坏最小码率的状态而填充数据”,& f. b6 c9 Q- W! Z% h
理解是,如果码率过低就填充无意义码(好浪费啊,不过可能是为了兼容性的原因),! W' U5 D% c4 w& \
英文版这一句没有翻译,还是日文。
8 S+ Z' V# I) o( h- H5 I+ b1 v" p. hCQ (固定品质),就是比MVBR多了一个主观质量值的设定。
b5 O5 l3 S) f7 Z9 j0 S! {. sRT-CBR (实时固定码率):连GOP层次的码率优化也不做了的CBR,快一点,质量不高
9 ~' K; ~; k6 j& DRT-CQ (实时固定品质):连GOP层次的码率优化也不做了的CQ,快一点,质量不高0 c7 k2 w3 B% Y ^# b. {
6)码率:这个码率是指CBR方式下的平均码率
. H1 v/ ~6 k I8 A- `) O9 w7)VBV缓冲区大小:缓冲区大的话,编码优化会好一些,但是解码的时候也要求大一些的缓冲区。1 j: }' n/ j3 B$ `0 ]7 t. P; N
因此,vcd/svcd标准中参数是固定的,否则可能机器无法播放。
, S/ j" K7 Q0 q$ U8)Pofile & level(类别与级别): 这个参数是mpeg1没有的。
. p4 ^+ V5 c- |0 x0 e在svcd/dvd应用中应该是MP&ML,模版自动选定。2 t5 ?% e2 G: q t8 D
MP&HL是为HDTV定义的,分辨率可以高达 1920x1100 .
$ T# B( V/ b. d7 e% [+ d9)制式:好象这个也是mpeg2相关的参数。我们应该用PAL.! w5 J" i3 _# I, t+ N
10) 隔行扫描:mpeg1只支持逐行扫描(25 frame/sec),mpeg2可以选择隔行(50 field/sec)。4 U) @* x. p6 V
如果成品在电视上播放,建议选择隔行,使运动平滑。但是隔行的视频在pc上看会有毛刺现象,; G3 U6 f6 F8 i: j5 B7 v& h
在水平运动景象中尤其明显。* ]3 b+ y) ^/ y+ H
11)播放时实现3:2下拉: 这是在film/NTSC制式转换中需要的,即在编码时维持帧率不变,
6 u6 g6 o! e1 g) ?4 q不做3:2下拉,而在播放中实现。参见B.advanced部分。感谢威龙指正。
! T2 V5 Z. D' e% N; c! s% ~12)YUV格式:给亮度/红色差/蓝色差分配的码位。对于人眼来说,亮度信号
" c0 i9 t% ]1 s1 w, g1 P0 E+ d是最敏感的,所以就分配比较多的编码空间以求精细,对于色差则粗糙些。一般就是4:2:0了。& w0 t8 B) N) I; ~6 M
(其实4:2:0方案给蓝色差的码位不是0,不知道为什么这样写)
. Y. ^6 D- |, ~4 B7 z& Y9 ~2 P13)DC分量精度:在mpeg编码中需要对8x8的图象块进行DCT(离散余弦变换),- j2 h; ~9 x+ \
DC分量的意义基本是代表8x8块中的平均值,一般需要为之分配比较大的编码空间,$ w4 A1 ]: R: x+ l# U
否则马赛克的边缘效应就比较明显。(8bit就不小啦,图象压缩中是每个bit的油水都要榨干的)
. Z# W/ ?! K- [1 l9 [5 U14)运动检测精度:mpeg是对I帧进行帧内编码,对P帧进行预测误差编码。就是对于P帧的图块,. O) B% o$ G/ U4 k7 X
在I帧中寻找对应的部分,然后对两个图块的差异部分进行编码,可以大大节省码率。% o! Y5 f* X* b" I# M+ J
运动检测精度越高,图块搜索匹配的范围越大,编码效率越高,同时编码速度越慢。* e9 q6 v2 \: B. P
这部分算法同样没有在mpeg标准中定义,各个厂商实现水平相差会很大。
3 B/ H% j6 f; L一般来说,在 tmpgenc中设置为普通即可。% [6 I. P% V! s) d
4 N# T9 n! _& wB. Advanced (影象源)部分:
; P3 }% ~( F; d& c$ l1 T本部分设置视频源相关的参数,以及在编码之前对视频源进行的预处理。$ [/ Z/ O2 [# J, t2 a
1)视频源类型:隔行扫描/逐行扫描。这个参数在打开视频源文件的时候会对之自动判断设置。4 f- I& Z$ \6 T
tmpgenc12版不能自动识别type1 DV,在12a版本中已经解决。参看的编码测试页。( N0 H. Q* R9 X8 W% c1 Q9 b) ]2 @
2)场顺序:这是整个 tmpgenc甚至整个桌面视频领域中最混乱的一部分。
& q/ }& z9 j9 O% _2 t, itmpgenc12a好象也不能根据视频源自动设置这个参数.% I# @. p: f7 o& M% R* r
在这个问题上搞了很久,才算明白了一点。这个参数是至关重要的,设置反了会造成生成2 E% Q4 v3 X- B' U/ k% r/ j2 K
图象的明显闪动,打个比方,一个物体的运动位置次序本来是1-2-3-4-5-6-7。。。,
$ c$ V- U+ c! G% ?) v设置反了以后就成了2-1-4-3-6-5-8。。。对于模拟视频源,其场序是由捕捉卡类型决定的,+ D d3 ^9 `' W0 `
对于dv,则定义为field order A。讲到这里还没有什么麻烦,但麻烦的是虽然场序只有2种,' M% v3 [8 A* s7 {% _/ E; W
对于他们的叫法却有3种:
, @! D* ]0 O' {" i7 b, }4 g. ]field order A/B (在ulead软件中的叫法),, m& a$ \! J. S
even/odd line first ( tmpgenc的叫法),. c. A A1 {0 E, f
field top/bottom first(bitrate viewer叫法),这3种叫法之间的对应关系是最让人头疼的。
, ?$ g4 G; B4 ^! s0 B; ?$ W在英文版的 tmpgenc12a中,缺省的设置为“even line first (field A)”,,
7 d- f0 l5 s$ |9 X: u6 J2 r6 w但在威龙汉化中缺省设置为“奇数场->偶数场”,曾就此请教威龙,威龙讲这是日文版的原意,
# z+ h+ V, i6 H. b M注意不要在字面上混淆了.
2 }8 O2 s- M7 p总之,3种叫法的关系是这样的:4 l0 L! L' }0 f5 k. V
field A = even line first(奇数场->偶数场) = field bottom first。 最可靠的方法,是用不同的
8 D$ [7 S8 w9 w1 l4 `设置对高速运动场景各生成一段隔行扫描的视频,并在电视上观察,应该能够看到差别。0 Q; [% `3 F- I- S4 b" E
3)视频源的宽高比: tmpgenc可以自动识别设置,一般应该为4:3* I* F9 |1 }+ t+ }; L/ a* j
625line PAL.# C f0 f3 F, K6 y+ D$ Y" u
4) 画面显示比例和位置:* L6 w: b" L5 Y$ R! z
一般选用“全画面显示并宽高比不变”,& }& S f5 V u
所谓“全画面显示并宽高比不变2”选项可能是会造成部分画面不可见,没有尝试过这一种。9 @% N/ x" a$ J) H- J
在4:3视频源中可能没有差别,但对于16:9宽屏影象在 4:3屏幕上输出而言,
2 E3 C$ f; e& V$ n9 t6 W“全画面显示并宽高比不变”是在上下留出空白,
% E1 _; |7 ]' ~* P( Y% ^ n“全画面显示并宽高比不变2”会截掉左右两端画面。。。没有这样试过,
. ]3 a; N! H' R6 y( F仅为猜测,不正确的地方请朋友们指正。
& _7 c$ a8 @' M, U5)滤镜选项组:
: B/ E4 Z8 j4 h% Q& i! E. S2 y8 z这一组设置可以对视频源进行预处理以提高影象质量。8 {" H% e* \; I9 o1 a( G5 v+ Z: d8 T
一般来说,都是在非编软件中实现这些功能的。% N) |3 }" Q% ^# |1 t
另外,对滤镜的使用要适度,因为客观上任何滤镜的使用都是引入了信息损失,8 G; X9 s6 |& X3 f$ |
这是对低品质视频源提高主观质量的代价。
3 ?, h$ L" `. a0 d8 E/ L影象源范围:选取部分影象源进行压缩
3 [' N% A e+ A: _24fps化:24fps是电影标准,一般不选
9 x4 V A& W% I. Y; j. B消除鬼影:鬼影是影象的重影,视频源不好的时候会出现。在dv中没有遇到过。: A0 d0 ]+ J' R2 J2 I4 D
消除噪音:在低光条件下的拍摄中影响中回出现明显的颗粒噪声,利用此滤镜可以消除。( ~/ j' x) p# O% |1 L* N9 V: T
不过副作用是平滑了图象,' |& e2 h) C# Y9 ^: I' g# ^
比如人的面部会象橡皮娃娃一样,光滑但没有质感。' U/ o/ ^7 B: l% r
锐化边缘:可以对横向/纵向边缘分别设置参数,做增强处理2 @% Q8 ~( t9 z2 J' Q+ @
简单色彩矫正:调整亮度,对比度,gamma,色度等
" q$ a! j' A1 G& n6 E高级色彩矫正:可以按照不同的色彩空间RGB/YUV等进行色彩矫正
4 D1 f* l9 K0 j消除交错信号(de-interlace):把隔行扫描的视频源转换成逐行扫描的视频, p: `" _# S# t: E! u- w* E3 p: b
如果对输出的视频设置为隔行扫描(如在打算电视上播放的svcd/dvd),则不要选用。
4 W7 V1 [0 h" m1 ?4 j认为在做vcd(逐行扫描mpeg1)时候也未必需要选用,要看视频源的大小决定。
, W# b% U$ A' `5 V- O比如用dv 576线,在做vcd时候只需要288线,简单舍弃一个场就可以,不需要deinterlace.$ L5 C7 C. u5 W4 @0 w
相反,如果视频源是352x288的隔行扫描视频,则需要做de-interlace.. S: ^. ^' N4 N. g! Z# ~& M- E3 O7 r
裁减画面:由于电视机播放视频的时候对边缘四周的部分做舍弃,6 K: L6 Y+ J3 D1 } u' J
所以可以利用这一点只对可见部分进行编码,这样可以加快编码速度,
3 n/ N- O7 y2 B8 b( V并且因为节省的码率可以利用在未裁剪区域从而提高画面质量。一般来说对上下左右各裁剪5%是安全的。
- z ?* u1 c2 X. ~3 Y3:2下拉:因film 24fps和 NTSC 30fps帧率不同,在制式转换中所需要做的调整。一般不用。
$ }. U' ~1 A( _9 X6 u+ Y4 a, T帧率不变:没什么好讲的) Q% d+ w3 B% l3 d" S
声音处理:可以增大/减小音量,并做声音的淡入/淡出。, o! B" ~" |- g! w; t& o o1 }% ~
, d# w' p' ]; mC. GOP结构$ \% N8 A( M; W% V+ S9 o" I
GOP = group of picture. 在mpeg中一个GOP就是一组时间上连续的画面。! y. K% T; V/ ~3 i- Z" J6 l2 n5 x
mpeg中的画面分为3种:I,P,B.I是内部编码帧,编码方式基本上就是jpeg的格式。; T$ g) S% |7 K1 b: B. G/ h
P是前向预测帧,编码方式是使用运动检测误差编码,参看A部分对运动检测的说明;
# V; k. T) j) KB是双向内插帧,根据前后I/P帧进行插值运算,对插值误差进行编码。9 U; S, }! E3 [! D
建议一般不要修改GOP结构,以取得压缩比例和图象质量之间的最好平衡。. _: @4 ~5 e4 \1 q5 ^9 p7 z! B; A
极端的例子是只用I帧,图象质量会有保证,但码流会很大。- L* b1 N+ C; r, |
1)输出编辑用的码流:这个选项会把GOP最后的B帧取消。因为B帧是双向内插的,) G2 r: t& W [9 `* U# G* }$ E/ _
其编码/解码不仅需要以前的I/P, 也需要以后的I/P帧。
9 w( \6 S! b, w# o7 ~取消最后的B帧,可以去除GOP之间的依赖性,从而便于编辑。
g# l0 N Q" T! @1 g; U; D: n2)检测场景变化:对于快速变化的场景,强行设置为I帧,以保证画面质量1 [9 V2 B7 M+ r, ]
3)手工强制设定帧类型:手工设定需要精细编码的画面帧为I帧。
. q# E4 Z& M7 I$ @) y结合MVBR码流控制可以全面控制码流分配。3 ~0 z' s2 ?9 ]- T5 X/ c/ y
* h& H5 A; y6 h& e* PD.量化矩阵
, ?! ]; s! y4 K# i& h" Nmpeg中的量化是对8x8 YUV 信号图块进行DCT变换之后的系数的量化。/ M' c! _3 v6 S1 L) v
通过对高频分量使用比较大的量化阶从而达; G1 {8 ^# k7 H5 v4 ~7 B
到减小高频分量的编码空间,达到压缩的目的。代价就是丧失图像细节,边缘模糊等。
& U: \6 h7 |) ?8 z* A: S% ?1)帧内编码量化矩阵:这是指对I帧使用的帧内编码量化矩阵
8 @0 h, T9 k$ ` P2)帧间编码量化矩阵:是指对非I帧的帧间预测误差编码所用的量化矩阵。威龙汉化版中叫外部矩阵。6 g8 Q. a: C( P2 s& t! l* z& I
3)矩阵模版的选择:建议对一般的视频选用mpeg标准,可以看到,其帧间编码矩阵统一为16,
6 A3 F3 C; f+ Y' O5 h* n `. M1 j这是因为帧间误差已经抵消了低频分量,高频分量丰富,所以和帧内编码矩阵有所不同。
, K9 @0 k1 g6 w9 W' a- |对于计算机动画尤其是2维线条为主的动画,
" J* }$ c& I& Z% `# b& C* v建议选用CG模版,,可以看到因为CG本身高频信号丰富,其帧内编码矩阵也统一为32。
4 F! j4 S" h9 r: ^5 J4 u另外,有朋友尝试减小量化矩阵的各个数值,认为这样做的意义不大。- e3 o3 s& E5 l, A
因为量化矩阵并不是量化的唯一因素, 事实上的量化程度要根据码流控制部分的反馈信息而自适应调整。9 g: `6 U) c1 b! t+ }
这样,即使量化阶减小,在码率有限的前提下,8 _+ | O( j* `2 M/ A+ ~0 p
量化系数还是会加大的。。5 X2 K6 q: G5 Y6 I+ [( X
4)YUV输出为YCrCb: YCrCb色彩空间分配给Y亮度信号的编码空间更大,如果视频源是YCrCb格式的话,' m* B% V" _, [. n- G
这个选项 可以增加画面质量。。不过一般都是采用YUV(CCIR601),
. s( U- i& w* n1 _如dv,所以不要选择这个选项,否则白白浪费码率。) \3 M7 E. x% W% h
5)浮点离散余弦变换:整点运算的速度比浮点要快很多,但精度不如浮点。3 S9 e, m8 E( t+ y. I( d
猜测这里的浮点其实只是把DCT变换的系数从8bit增大为16bit的精度,- a/ T# z( C5 l
并不需要浮点运算器单元参与变换,否则速度是不可忍耐的。
H; n4 L: a- J; ?2 g' E6)不对静止部分做半像素的运动检测:由于视频源是隔行的,对于精细的静止边缘线条(1个像素宽度)! @; i8 z1 y6 ]
比如静止字幕会出现一个场中出现,另一个场中不出现的闪动。选中这个选项会消除闪动。。6 I) p; C+ d2 H
不过觉得好像这个和量化矩阵无关。
; Z! d" v4 q3 I N7)柔化马赛克:没什么好说的。就是在8x8图块的边缘做一些特别处理。& }* O. ~ m4 w( _" z
能用足够的码率或者码率控制手段解决马赛克最好,
. c$ l. ?3 B- ?/ N1 i" p因为这里的柔化虽然只对边缘进行低频滤波,毕竟还是会对画面造成影响模糊化。0 x9 s7 Y0 K( S9 s+ g- a
! M2 m1 B, i& j* K/ l, H6 d+ KE. 音频:7 P, q7 c4 G+ H- u& k5 t& [
这部分大多不需要改动vcd/svcd模版。也没有大的影响。不多讨论。% l0 A, O5 P% W9 f" f3 y$ E Q z" G
6 }" S' m! O7 F b9 sF. 系统:* f4 R6 f* p- h8 l/ Z, x" F
mpeg的系统是指视频+音频。vcd/svcd/dvd模版中已经设定好。(1 Z# M9 Y, B% R7 q; L2 P9 H! A$ L
; B4 w% u" Y S3 w+ G2 C! t% W[ 本帖最后由 goodskycn 于 2011-7-27 19:05 编辑 ] |
|