任务书 开题报告 文献综述 英文翻译 选题表 中期检查表

江汉大学毕业论文(设计)任务书

  物理与信息工程  学院  通信与电子信息 

  电子信息工程  专业

题目:IP可视电话的通讯协议和视频编码及码率控制

起止日期:20##年12月20日 至 20##年5月30日

学生姓名:                             

学    号:                            

指导教师:               

教研室主任:____________     年   月   日审查

系  主  任:                  年  月   日批准

学生进行毕业论文(设计)前,指导教师应填好此任务书,经教研室、系主任签字后,正式给学生下达任务。


江汉大学毕业论文(设计)

开 题 报 告

  论文题目 电子商务环境下物流企业经营战略分析

(英  文) E-commerce logistics analysis of

enterprise management strategy 

    学    院 物理与信息工程学院

    专    业                      

    姓    名                       

    学    号                       

    指导教师       张 霞     

20##年1月 26日

注:本页为毕业论文(设计)开题报告的封面,请将开题报告正文装订于后。


开题报告

一.  课题背景

所谓可视电话,是一种通过电话网、互联网、无线网或卫星等通信线路,并利用IP、宽带等数字通信技术在两个或两个以上地点之间同时进行语音、彩色活动图像和数据信息双向、对称、实时传送的视听多媒体终端设备,可分为有线固定电话和手机两大类。有线可视电话终端由电话机、摄像头、视频接收显示装置等设备组成,通常它有桌面式可视电话、电视可视电话以及电脑可视电话3种形式。

IP可视电话使人们在通话时能够看到对方影像,是一种发展前景看好的多媒体通信设备,它不仅适用于家庭生活,而且还可以广泛应用于各项商务活动、远程教学、安防监控、医院护理、医疗诊断、科学考察等不同行业的多种领域。随着科学技术的进步和人民生活水平的提高,打破了原先的技术条件和经济状况的限制,大规模发展可视电话成为可能。可视电话在家庭、厂矿、医疗、环保、传媒甚至帮助残障人士等方面有着广泛的应用前景。常言道“百闻不如一见”,大约有60% ~70%的有效信息来自于“面对面”的视觉,这就是集“顺风耳”和“千里眼”功能于一身可视电话充满魅力的原因所在。

二.  研究目的以及意义

近几年来,世界电信发达国家的固话运行商都把开拓可视电话业务作为弥补因移动电话快速增长丢失市场份额的手段,并最终实现用可视电话来替代目前音频固话的发展目标。法国电信公司宣称正在建设全球规模最大的IP可视电话网络,将覆盖占法国总人口75%的区域范围。新推出的可视电话机还具有画中画、USB接口、留言信箱等各种时尚功能。据悉,其通话费用将低于目前手机通话费,前景十分看好。

我国电话装机总量如今已位居世界第一。目前,我国电话用户已达2.5亿,而且每年正以接近2000万户的速度增长,未来5年将达到4亿户,其中城市电话普及率达80%以上。以1.2亿城市电话用户计,即使有10%先富起来的人购买可视电话,就是1200万部,市场规模即可达到50亿元左右。另有资料表明,全球视讯设备市场规模已经达到40亿美元,其中单机式的可视电话约占两成,可见发展IP可视电话的市场大、具有很大经济价值。

随着ADSL宽带网络、液晶显示屏等电子器件成本的大幅度下降,原本阻碍可视电话进入千家万户的技术和价格两大障碍正在逐步消失。过不了多久,每台售价仅与目前家庭无绳电话相当的可视电话就会出现在大卖场的货架上,而能与当今IP电话资费相媲美的话费支出更能被众多普通家庭所接受。毋庸置疑,可视电话一旦打开“雪崩之门”,我国的电话通信历史将会发生质的变化。

三.  国内外研究现状以及发展趋势

目前,国内外主流的视讯设备都采用基于ITU T H系列的国际标准。国际上可视应用的生产和供应厂商主要在欧美地区,数目不多,价格较高,而且主要是面向企业的商业应用。  
  我国可视电话起步虽然比国外晚,但技术标准是与世界同步的,在核心编解码芯片方面,国内厂商引进、消化、吸收国外先进芯片的研制技术,并运用到国内产品中。我国已研制成功和正在合作开发可视电话的企业达到数十家,一些企业采用自己的技术生产的可视电话,其性能已可以与国外同类产品相媲美,且市场价远远低于进口产品,还有一部分国内产品出口国外。

实际上,我国从90年代开始就一直有很多厂家开始研制可视电话,这两年,加入视讯设备的研究和生产的厂家更多了。不但有电信产品起家的华为、中兴通讯、大唐电信等大型上市公司,另外大型家电企业也加入了其中,例如长虹、TCL等厂商都在研制自己的可视电话。再加上豪义慧通、浙江南望、杭州远见、上海贝岭等众多厂家,一时间,可视电话领域可谓是高手云集、热闹非凡。研发、生产和市场开发等前期投资需要2000万元至4000万元人民币,但至少可以维持30%的利润率。而基于普通电话网的可视电话,技术相对低端,投资门槛也相对低一些。目前在国内,长虹和紫光等厂家主要是开发基于普通电话网的可视电话,而豪义慧通、中兴、华为等是以生产IP可视电话为主。

四.  研究的内容、途径及技术路线

可视电话业务是一种集视频、语音于一体的多媒体通信业务,用户进行语音通话的同时,通过终端的屏幕看到对方的视频图像,同时将自己的本地图像传输到对方。在目前网络IP化的大趋势下,可视电话也多以IP可视电话的形态出现,本文 IP可视电话主要研究基于H.323技术实现的IP可视电话网络技术。在基于H.323技术实现的IP可视电话网络中,通过驻地网守(在驻地IP网中所设的用户网守,同时完成呼叫代理功能),将设在用户端的IP可视电话终端接入IP可视电话网。  

五.  工作的主要阶段、进度和技术指标

       二月份,了解IP可视当前发展技术指标以及系统构架,熟悉OPenBSD中的网络协议栈在PSOS+上的移植和相关网络通信协议如PPPoE、SMTP、PoP3、IMAP、DNS、DHCP等在可视电话中的实现,以及嵌入式Web服务器在可视电话中的实现,收集并参考相关资料。

       三月份,仔细研究TCP/IP Protocol、H.323标准协议、H.26X图象压缩和解压缩标准以及G.723.1语音压缩和解压缩标准;分析码率控制原理技术方案。

       四月份,在前面预备知识条件下制定各通信模块具体技术方案,搭建系统组架,主要分三大模块分别进行研究;完成论文中期检查。

五月份,最终完成论文撰写,准备答辩。

六.  最终目标及完成时间

最终目标是弄清楚IP可视电话的可行性技术方案,掌握将数字电话通信与视频编解码技术融合起来,并在宽带IP网络中实现的技术。论文最终完成时间为5月30日。


江汉大学毕业论文(设计)

文献综述

论文题目:电子商务环境下物流企业经营战略分析

(英  文):E-commerce logistics analysis of

enterprise management strategy 

          学    院  物理与信息工程学院

专    业                        

姓    名                        

学    号                        

指导教师        张 霞      

20##年3月2日


文献综述

IP可视电话本论文方案采用的H.323协议是国际电信联盟ITU-T于1996念公布的,它是局域网和企业网使用的多媒体通信标准。H.323是Internet上端与端之间进行实时声音和视频会议的规程和协议,包括系统和构件的描述、呼叫模型的描述、呼叫信令过程、控制报文、服用、语音编码解码器、视像解码器及数据协议,但它不保证服务质量QoS。

H.323建议实际上是一个协议族,它包括了如下子建议:H.225.0规范了多媒体信息流的分组化、同步化、控制信息流的分组化和控制信息的格式;H.245管理包括能力交换、逻辑信道的开和关、模式优先权请求、流量控制及通用命令的指示,H.245信令在两个终端间或一个终端与多个点控制单元间建立。
    一、H.323的体系结构

H.323是ITU多媒体通信系列标准H.32x的一部份,该系列标准使得在现有通信网络上进行视频会议成为可能,其中,H.320是在N-ISDN上进行多媒体通信的标准:H.321是在B-ISDN上进行多媒体通信的标准:H.322是在有服务质量保证的LAN上进行多媒体通信的标准:H.324是在GSTN和无线网络上进行多媒体通信的标准。H.323为现有的分组网络PBN(如IP网络)提供多媒体通信标准。若和其它的IP技术如IETF的资源预留协议RSVP相结合,就可以实现IP网络的多媒体通信。基于IP的LAN正变得越来越强大,如IP over SDH/SONET、IP over ATM技术正在快速发展以及LAN 宽带正在不断的提高。由于能提供设备与设备、应用与应用、供应商与供应商之间的互操作能力,因此,H.323能够保证所有H.323兼容设备的互操作性。更高速率的处理器、日益增强的图形器件和强大的多媒体加速芯片使提PC成为一个越来越强大的多媒体平台。H.323可提供PBN与别的网络之间进行多媒体通信的互连互通标准。许多计算机、网络通信公司,如Inter、Microsoft和Netscape都支持H.323标准。H.323标准包括在无QoS保证的分组网络中进行多媒体通信所需的技术要求。这些分组网络包括LAN、WAN、Internet/因特网以及使用PPP等分组协议通过GSTN或ISDN的拨号连接或点对点连接。

H.323的体系结构

从整体上来说,H.323是一个框架性建设,它涉及到终端设备、视频、音频和数据传输、通信控制、网络接口方面的内容,还包括了组成多点会议的多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)、网关以及关守等设备。它的基本组成单元是"域",在H.323系统中,所谓域是指一个由关守管理的网关、多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)和所有终端组成的集合。一个域最少包含一个终端,而且必须有且只有一个关守。H.323系统中各个逻辑组成部份称为H.323的实体,其种类有:终端、网关、多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)。其中终端、网关、多点控制单元(MCU)是H.323中的终端设备,是网络中的逻辑单元。终端设备是可呼叫的和被呼叫的,而有些实体是不通被呼叫的,如关守。H.323包括了H.323终端与其它终端之间的、通过不同网络的、端到端的连接。

二、H.323终端的组成

H.323为基于网络的通信系统定义了四个主要的组件:终端(Terminal)、网关(Gageway)、关守(Gagekeeper)、多点控制单元(MCU)。终端是分组网络中能提供实时、双向通信的节点设备,也是一种终端用户设备,可以和网关、多点接入控制单元通信。所有终端都必须支持语音通信,视频和数据通信可选。H.323规定了不同的音频、视频或数据终端协同工作所需的操作模式。它将是下一代因特网电话、音频会议终端和视频会议技术的主要标准。各个功能单元及其标准备或协议分别是:

  视频编解码(H.263/ H.261):完成对视频码流的冗余压缩编码。

  音频编解码(H.723.1等):完成语音信号的编解码,并在接收端可选择地加入缓冲延迟以保证语音的连续性。所采用的标准为ITU-T的H.723.1,它提供5.3kbit/s和6.3kbit/s两种码率,采用线性预测综合分析编码方法,分别使用代数码本激励线性预测和多脉冲最大似然量化,从而各自获得编码复杂度和质量的优化。

  控制单元(H.245):提供端到端信令,以保证H.323终端的正常通信。所采用的协议为H.245(多媒体通信控制协议),它定义了请求、应答、信令和指示四种信息,通过各种终端间进行通信能力协商,打开/关闭逻辑信道,发送命令或指示等操作,完成对通信的控制。

  H.225层:将视频、音频、控制等数据格式化并发送,同时从网络接收数据。另外,还负责处理一些诸如逻辑分帧、加序列号、错误检测等功能。

 三、H.323标准协议簇

H.323是国际电信联盟(ITU)的一个标准协议栈,该协议栈是一个有机的整体,根据功能可以将其分为四类协议,也就是说该协议从系统的总体框架(H.323)、视频编解码(H.263)、音频编解码(H.723.1)、系统控制(H.245)、数据流的复用(H.225)等各方面作了比较详细的规定。为网络电话和可视电话会议系统的进一步发展和系统的兼容性提供了良好的条件。其中系统控制协议包括H.323、H.245、和H.225.0,Q.931和RTP/RTCP是H.225.0的主要组成部份。系统控制是H.323终端的核心。整个系统控制由H.245控制信道、H.225.0呼叫信令信道和RAS(注册、许可、状态)信道提供,音频编解码协议包括G.711协议(必选)、G.722、G.723.1、G.728、G.729等协议。编码器使用的音频标准必须由H.245协议协商确定。H.323终端应由对本身所具有的音频编解码能力进行非对称操作。如以G.711发送,以G.729接收。视频编解码协议主要包括H.261协议(必选)和H.263协议。H.323系统中视频功能是可选的。数据会议功能也是可选的,其标准是多媒体会议数据协议T.120。

在H.323多媒体通信系统中,控制信令和数据流的传送利用了面向连接的传输机制。在IP游戏栈中,IP与TCP协作,共同完成面向连接的传输。可靠的传输保证了数据数据包传输时的流量控制、连续性以及正确性,但也可能引起传输时延以及占用网络宽带。H.323将可靠的TCP用于H.245控制信道、T.120数据信道,呼叫信令信道。而视频和音频信息采用不可靠的、面向非连接的传输方式,即利用用户数据协议UDP(User Datagram Protocol)。UDP无法提供很好的QoS,只提供最少的控制信息,因此传输时延较TCP小。 在有多个视频流和音频流的多媒体通信系统中,基于UDP和不可靠传输利用IP多点广播和由IETF实时传输协议RTP处理视频和音频信息。IP多播是以UDP方式进行不可靠多点广播传输的协议。RTP工作于IP多播的顶层,用于处理IP网上的视频和音频流,每个UDP包均加上一个包含时间戳和序号的报头。若接收端配以适当的缓冲,那么它就可以种用时间戳和序号信息"复原,再生"数据包、记录失序包、同步语音、图像和数据以及改善边接重放效果。实时控制协议RTCP用于RTP的控制。RTCP监视服务质量以及网上传送的信息,并定期将包含服务质量信息的控制信息包发分给所有通信节点。

参考文献:

[1]  Douglas E.Comer(美).  TCP/IP 网络互连技术 卷1:原理、协议和体系结构(第3版).  清华大学出版社, 1999

[2] 张灯银,张小英. IP电话技术原理与应用.  人民邮电出版社,2000

[3] 王瑞刚. IP电话终端设备--原理、电路及应用. 西安电子科技大学出版社,2003

[4] 刘峰. 频图像编码技术及国际标准/视频通信. 北京邮电大学出版社,2005

[5] 张虹,夏士雄,张薇,梁银. 计算机网络多媒体技术用. 机械工业出版社,2003

[6] ITU-T Recommendation H.263, V ideo coding for low bit rate communication,1998

[7] ITU-T Recommendation G.711, Pulse codemodulation (PCM ) of voice frequencies,1998

[8] DouglasE.Comer&DavidL.Stevens.  Internet working with TCP/IP VolIII: Client-Server Programming and Applications, BSD Socket Version,2nded.  Tsinghua University Press,2000


江汉大学毕业论文(设计)

英文及其翻译

论文题目 电子商务环境下物流企业经营战略分析

(英  文) E-commerce logistics analysis of

enterprise management strategy 

           学    院 物理与信息工程学院

专    业                        

姓    名                       

学    号                        

指导教师        张  霞      

20##年3月22日


English text:                 

IP Video phone solution

Abstract:

By proposing some improved algorithms and applying some new techniques, a new software-based video conferencing term inal is implemented. Based on a PII333 processor and Windows NT operating system, this video conferencing term inal can encode and decode a video signal about 15 frame/s with CIF formats together with an audio signal encoding and decoding in real time.

(1)    Select IP video telephony solutions for the key

Today's video phone technology market (mainly by video conferencing and video telephony terminal equipment components) tend to grow steadily. With broadband Internet access, advanced integrated system-on-chip (SoC) functional structure of the rapid, widespread adoption, as well as digital multimedia processor performance enhancement, a wide range of new applications has become possible, including IP-based video phone . New video compression / decompression algorithm, for instance, the International Telecommunication Union (ITU) H.264 video compression standard, and increasingly effective network bandwidth use, these have enhanced IP video phone function, enhance the product's market penetration Rate.

IP-based video phone for the end-user provides a most reliable and affordable contact information, can be effective in achieving two-way audio / video communication. Early in the products, high cost of the expensive hardware components and systems for the cost of ISDN lines hinder the widespread adoption of video telephony, IP-based video equipment limited to the relatively small number of commercial use of. However, with video and broadband technology development, IP-based video phone to reduce costs, has begun to enter the general consumer market. Although the majority of users, audio / video quality and the total cost is still the major concern, but consumers in the investment business systems or domestic purposes should also be considered before a variety of key factors.

①           Easy to use

Most importantly, the IP-based video equipment should be easy to install and use. IP equipment is not yet a mainstream technology, consumers do not know what IP address, I do not know how to build IP networks. Consumers need to be able to plug and play equipment. In order to ensure that the real need right out of the box experience, an IP equipment should be automatically configured and bridge the existing network received. If a company must be installed to the scene, then its customers in the loss of profits.

While certainly there are some mechanisms to allow expert-configured IP equipment, but for ordinary users to provide IP services is the best way to avoid in-depth study of the concept of IP technology. But a more effective way, the technology will be converted into the user interface already familiar with the way. For example, is not to provide a user input by the operator to the IP address of the screen, but require users to enter a "sequence", similar to those already skilled users to use the phone number. This is only the user to avoid non-essential by those who use the technical terms and concepts confusing one of the ways to make IP video phone users to enjoy the benefits.

②           Reliability

Do not have enough bandwidth, video quality will completely collapse. People's faces become blurred, sound and image can not keep pace: in his speech during the voice and image distortion may very. In order to avoid wasting the available bandwidth and hardware must be reliable connectivity, and software to provide a super error recovery mechanisms to avoid wasting the available bandwidth. Because of the high-quality IP meeting the continuing needs of the industry is developing new standards and protocols to address the network is not reliable and shortcomings with the problem, particularly for wireless networks. For example, compared to the existing H.263 standard, the new H.264 video compression standard can provide better video quality and error recovery characteristics.

③           Completely software programmable

The programmable digital media processor implementation of software encoding / decoding speed fast enough, I can provide full-duplex, real-time streaming video. Software Implementation of the main advantages is through a software upgrade to support a new encoder / decoder algorithm. This makes the whole product line using a common hardware and thus a single product can support a different encoding / decoding standards, while also reducing manufacturing costs.

Unlike programmable device can be configured equipment or part of programmable device. Can be configured or part of programmable equipment often use hardware key encoding / decoding functions. Based on their expedite the processing of these features when the codec performance, however, they can not support other functions based on the codec, but also because the new codec based on the new methods, so they may not be able to support the new codec standards.

Complete software programmability to seamlessly add new features is also essential, but also connect to other IP-based equipment necessary. To be able to connect to a TV as an example of IP video phone. When users buy a high-definition TV, what will happen? » Unless the videophone flexible enough to support both standard TV and also support high-definition TV, otherwise it would be eliminated. Please note that the video phone is no need now to support high-definition TV sets, but the important thing is that once high-definition TV market to take off, it can in the future to support high-definition TV. Completely software programmable video phone has to make in the future of even more advanced codecs flexibility.

④           Performance margin

The implementation of the new standards require IP equipment has the flexibility to support new standards, improve performance and meet the requirements of the margin. For example, the new H.264 standard requires each slice to deal with 41 motion vectors, and deal only with a campaign of H.263 vector compared with a lot of improvement. To deal with these additional motion vectors on the need for higher computing power. Therefore, the H.263-based equipment on the implementation of the H.264 on the need for additional performance margin or not to use some of the processing functions.

Balance the initial cost of the product at the same time have a sufficient margin of equipment, this is a delicate issue, it needs a thorough understanding of the target market of price sensitivity. However, it is important to realize that we must leave room for future improvement, not just a new codec.

One can change their equipment to monitor its security features can also be changed, for instance, can be transmitted through the Internet protected audio and video content, which requires additional encryption and authentication resources. Whether now or in the future, performance margin in respect of these features are essential.

(2)     Software solutions

  Implementation of software solutions

A basic video conferencing terminal should include: Audio and Video Collection to capture, audio and video encoding and decoding audio and video, audio and video playback. Including audio and video encoding and decoding is the core part. Given the use of software, audio and video quality must be calculated The complexity and total output rate among find a balance. Here involves the selection of an agreement. Video on the agreement, starting from the quality and bit rate, the choice of H.263 to achieve. Audio agreement by G. 711 is to reduce the amount of computation, but it is also the most basic audio coding agreement. Experiments show that the optimization of G.711 audio codecs the CPU utilization can be ignored. G.711 course, the bit rate than G.723, G. 729, and other audio codecs agreement must be high, but with the video of the occupier, an increase of not much.

Agreement to consider the concrete realization of the two main parts: (1) module of the agreement algorithm optimization, (2) application of the special nature of the area of research and pure calculating speed up. The former is an agreement for the use of the code left behind by flexibility, by Speed and accuracy of compromise to achieve the objective of speeding up the encoding. DCT transformation can be used as floating-point operations and fixed-point operator, it is clear that sentinel computing faster, but accuracy will decline in the same motion compensation algorithm there are many, such as full-search , The number of two-dimensional, three-step method, conjugate the direction of law, different sports have different valuation method of complexity, accuracy and also different, whereas the latter focuses on practical application and operation of environmental analysis, integration Improve the software algorithms to prepare the actual efficiency of the operation procedures meet the requirements of real-time.

②  Video Coding results

In order to fully reflect the new algorithm and the advantages of new technology, taking into account the entire system for video encoding the most time-consuming process, the ability-to-end real-time greatest impact, so we separate video encoding, set out the priorities of the new algorithm in the performance of testing and comparison China, the paper used for the test environment: the operating system used W indow sNT 4.0, PC computer's basic configuration Intel Pentium processor chip PII333 and 128 M memory. Testing the stream to a CIF format of the 300 collected at the scene of the series. The image Sequencing the background than the standard sequence M issAmerica complex, and the prospects of the movement and more intense, more realistic scenes of the meeting.'s Basic algorithm to compare two: Open the code Telenor TMN20 and our optimization algorithm.

Telenor's TMN20 the code contains a lot of debugging information, and to achieve standards-based, it did not conduct any optimization, so slowly. Can be seen from the table after a C-language optimization, scene detection and treatment of the MMX technology than the new algorithm Telenor TMN20 the full speed of about 13 times faster, and the image quality alone dropped by the human eye can not be aware of 0.02 dB.

③  Software video conferencing terminal

Test environment and video encoding used by the environment exactly the same. For this environment, running a video conferencing terminal of a suite of software: H.263 video encoding and decoding, G.711 audio encoding and decoding. In the field tests, video software Of the terminal can be achieved 15 / s, CIF format of real-time video and 64 kbit / s real-time voice processing requirements, and voice and image of good quality.

④  Conclusion

Through audio and video codecs agreement on the research and analysis of video of the scene, with MMX technology and VC + + optimization techniques, the paper designed to achieve a set of software-based video conferencing terminal. This terminal operation of the hardware and software for the Intel Pentium environmental requirements Processor chip PII333, 128M memory, and W indow s operating system. Experiments show that the system can become a terminal H.323 products to more ideal quality audio and video (15 frames / s, CIF format) real-time processing.

References:

1        ITU-T Recommendation H.263- 1998, V ideo coding for low bit rate communication.

2        ITU-T Recommendation G.711- 1998, Pulse codemodulation (PCM ) of voice frequencies.

3        Intel Corporation. Intel architecture MMXTM technology programmer’s referencemanual[Z. 1996.

4        ARA I Y, AGU I T, NAKAJIMA M. A fastDCT2SQ scheme for images. Trans IEICE, 1998, 1095-1097.

5        ITU-T Recommendation H.323—1998, Packet based multi media communications systems.

中文翻译:

IP可视电话解决方案

摘要

在对音视频协议和视频会议实际应用场景分析的基础上, 采用新算法和新技术, 在 IntelPII333 的PC 机上用软件实现了视频会议终端的音视频实时编解码处理. 实验结果表明该软件能同时完成 15 帧/s、CIF 格式的H.263 视频编解码和G.711 语音编解码, 实现了以软件为核心的视频会议终端.

(1)  选择IP可视电话解决方案的关键

今天的可视电话技术市场(主要由视频会议和可视电话终端设备组成)趋于稳定增长。随着宽带互联网接入、高级集成系统级芯片(SoC)功能架构的迅速、广泛采用,以及数字多媒体处理器性能的提升,各种各样的新型应用已经成为可能,包括基于IP的可视电话。新的视频压缩/解压缩算法,比如说国际电信联盟(ITU)的H.264视频压缩标准以及日益有效的网络带宽利用,这些都增强了IP可视电话的功能,提升了该产品的市场普及率。

基于IP的可视电话为最终用户提供了一种目前最可靠,而且负担得起的联系方式,可以有效地实现双向音频/视频通信。在早期的产品中,成本高昂的硬件系统元件和昂贵的专用ISDN线路费用阻碍了可视电话的广泛采用,将基于IP的视频设备局限在相对较少的商业用途中。然而,随着视频和宽带技术的发展,基于IP的可视电话成本降低,开始进入普通消费者市场。尽管对大部分用户来说,音频/视频质量和总成本仍然是关注的主要因素,但消费者在投资商业系统或家庭用途之前还应该考虑多种关键因素。

①      易于使用

最为重要的是,基于IP的视频设备应当便于安装和使用。IP设备目前还不是一种主流技术,普通消费者不知道IP地址是什么,不知如何构建IP网络。消费者需要的是能够即插即用的设备。为了确保真正的无须开箱的体验,一个IP设备应该自动完成配置,并桥接到现有网络。如果一个公司必须到现场进行安装服务,那么它就在客户处损失了利润。

虽然肯定存在一些机制,允许专家人工配置IP设备,但为普通的IP用户提供服务的最好方法就是避免深入研究IP技术的概念。而是采取更为有效的办法,将技术接口转换成用户已经熟悉的方式。例如,不是提供一个请用户输入运营商所给IP地址的屏幕,而是要求用户输入一个“序列号”,这类似于用户已经熟练使用的电话号码。这只是避免用户被那些用非必需的技术术语和概念搞糊涂的方法之一,使用户享受IP可视电话带来的好处。

②      可靠性

没有足够的带宽,视频质量就会完全崩溃。人的面容变得模糊,声音无法和图象保持同步:在谈话期间声音和图象都可能非常失真。为了避免浪费可用的带宽,硬件连接必须可靠,而且软件必须提供一个超级的错误恢复机制以避免浪费可用的带宽。 由于存在对高质量IP会议的持续需求,业界正在开发新标准和协议以解决网络不可靠和带有缺陷的问题,特别是针对无线网络。例如,与现有的H.263标准相比,新的H.264视频压缩标准可以提供更好的视频质量以及错误恢复特性。

③      完全软件可编程性

现在的可编程数字多媒体处理器执行软件编码/解码的速度足够快,因而可以提供全双工、实时流视频。软件实现方法的主要优势是可以通过软件升级来支持一种新的编码/解码算法。这使得整个产品系列采用共同的硬件,因而单一产品可以支持不同的编码/解码标准,同时还可降低制造成本。

可编程设备不同于可配置设备或部分可编程设备。可配置或部分可编程设备常常要用硬件实现关键的编码/解码功能。它们在加速处理基于这些功能的编解码时性能优异,然而,它们无法支持基于其它功能的编解码,而且由于新的编解码基于全新的方法,因此它们很可能无法支持新的编解码标准。

完全的软件可编程性对于无缝添加新特性也是必需的,而且是连接其它基于IP的设备所必需的。以一个可以连接到电视机的IP可视电话为例。当用户购买一台高清晰度电视机时会发生什么情况呢?除非该可视电话足够灵活,既支持标准电视机,又支持高清电视机,否则它就被淘汰。请注意该可视电话没必要现在就支持高清电视机,但重要的是,一旦高清电视机市场起飞,它就能够在将来支持高清电视机。完全的软件可编程性使得可视电话具有可在将来实现更先进编解码的灵活性。

④      性能裕量

实施新标准经常需要IP设备具有支持新标准的灵活性,以及满足提高性能要求的裕量。例如,新的H.264标准要求每个宏块要处理41个运动向量,与只处理一个运动向量的H.263相比具有了很大的改进。要处理这些额外的运动向量就需要更高的运算能力。因此,在基于H.263的设备上实施H.264就需要额外的性能裕量或者某些还没用到的处理功能。

平衡初始产品成本同时又留有足够的设备性能裕量,这是个微妙的问题,它需要透彻了解目标市场对价格的敏感性。然而,重要的是要意识到必须为将来的改进留有余地,而不仅仅是实现新的编解码。

一个设备可以变更其所接的显示器,它的安全功能也可改变,比如说可通过因特网传送受保护的音频和视频内容,这需要附加的加密和认证资源。不管是现在还是将来,性能裕量对于获得这些功能都是必需的。

(2)软件方案:

  软件方案的实现

一个基本的视频会议终端应该包括: 音视频采集捕捉, 音视频编码, 音视频解码, 音视频回放. 其中音视频的编码和解码是核心部分. 鉴于采用软件实现, 所以必须在音视频质量、计算的复杂度和总的输出码率三者之间找到一个平衡点. 这里涉及到了一个协议选择问题. 就视频协议而言, 从质量和码率出发, 选择H.263 的实现. 音频协议采用G.711 是为了降低计算量,同时它也是最基本的音频编码协议. 实验表明, 优化的G.711 音频编解码的CPU 占用可忽略不计. 当然G.711 的码率显然比G.723、G.729 等音频编解码协议要高, 但是与视频的占用相比较, 增加并不多.

协议的具体实现主要考虑两个部分: (1)协议算法模块的优化选择; (2)应用领域的特殊性研究和纯粹的计算加速. 前者利用的是协议为编码所留下的灵活性, 通过速度与精度的折中,以达到加速编码的目的. 如DCT 变换可以采用浮点运算和定点运算, 显然, 定点运算速度更快, 但是精度会下降; 运动补偿的算法同样有许多, 如全搜索、二维对数法, 三步法, 共轭方向法等, 不同的运动估值算法拥有不同的复杂度, 精度自然也各不相同. 后者则侧重于实际应用与运行环境的分析, 结合算法提高软件编写的实际效率, 使程序运行满足实时要求.

  视频编码的实验结果

为了充分体现新算法和新技术的优势, 同时考虑到视频编码为整个系统最耗时的过程, 对终端的实时能力影响最大, 所以我们单列视频编码, 阐述新算法的优在性能的测试和比较中, 本文采用的测试环境为: 操作系统采用W indow sNT 4.0, PC 电脑的基本配置 Intel Pentium 处理器芯片PII333 与 128M 内存. 测试的码流为一个CIF 格式的 300 帧现场采集的序列. 该图像序列的背景比标准序列M issAmerica 复杂, 前景的运动也更为剧烈, 更加符合实际的会议场景. 进行比较的基本算法有两个: 公开代码Telenor 的TMN20 和我们的优化算法.

Telenor 的TMN20 的代码中含有大量的调试信息, 且以实现标准为主, 故未进行任何优化, 所以速度缓慢. 从表1 可以看出经过C 语言优化、场景检测和MMX 技术处理的新算法比Telenor 的TMN20 速度足足快了约13 倍, 而图像质量仅下降了人眼觉察不到的0.02 dB.

③      软件视频会议终端

测试环境与视频编码所采用的环境完全一致. 基于此环境, 同时运行了视频会议终端的一整套软件:H.263 视频编码和解码,G.711 音频编码和解码. 在现场测试中, 软件视频会议终端能够达到15 帧/s、CIF 格式的实时视频和 64 kbit/s 的实时语音处理要求, 并且声音与图像质量良好.

④      结 论

通过音视频编解码协议的研究以及对视频会议的场景分析, 结合MMX 技术和VC+ +的优化技巧, 本文设计出一套基于软件实现的视频会议终端. 此终端运行软硬件的环境要求为Intel Pentium 处理器芯片PII333、128M 内存以及W indow s 操作系统. 实验表明该系统能够成为H.323 的一个终端产品, 以比较理想的质量进行音视频(15 帧/s、CIF 格式)实时处理.

参考文献:

1      ITU-T Recommendation H.263- 1998, V ideo coding for low bit rate communication.

2      ITU-T Recommendation G.711- 1998, Pulse codemodulation (PCM ) of voice frequencies.

3      Intel Corporation. Intel architecture MMXTM technology programmer’s referencemanual[Z. 1996.

4      ARA I Y, AGU I T, NAKAJIMA M. A fastDCT2SQ scheme for images. Trans IEICE, 1998, 1095-1097.

5      ITU-T Recommendation H.323—1998, Packet based multi media communications systems.

江汉大学毕业论文(设计)中期检查表

 物理与信息工程 学院 电子信息工程系                          2012 年4月12 日

指导老师: 张霞               系(部)负责人:                 学院负责人

相关推荐