[.net] 关于.net线程问题总结(二)

yld387xs

浏览: 15015 次

最近访客更多访客>>

vistaorg

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2012-01 ( 19)
更多存档...

博客分类：

技术杂绘

[.net] 关于.net线程问题总结(二)
2011年01月03日
　　经常看到名为BeginXXX和EndXXX的方法，他们是做什么用的？
　　这是.net的一个异步方法名称规范
　　.Net在设计的时候为异步编程设计了一个异步编程模型（APM），这个模型不仅是使用.NET的开发人员使用，.Net内部也频繁用到，比如所有的Stream就有BeginRead，EndRead，Socket,WebRequet,SqlCommand都运用到了这个模式，一般来讲，调用BegionXXX的时候，一般会启动一个异步过程去执行一个操作，EndEnvoke可以接收这个异步操作的返回，当然如果异步操作在EndEnvoke调用的时候还没有执行完成，EndInvoke会一直等待异步操作完成或者超时。
　　.Net的异步编程模型（APM）一般包含BeginXXX，EndXXX，IAsyncResult这三个元素，BeginXXX方法都要返回一个IAsyncResult，而EndXXX都需要接收一个IAsyncResult作为参数，他们的函数签名模式如下
　　IAsyncResult BeginXXX(...);
　　 EndXXX(IAsyncResult ar)；
　　BeginXXX和EndXXX中的XXX，一般都对应一个同步的方法,比如FileStream的Read方法是一个同步方法，相应的BeginRead(),EndRead()就是他的异步版本，HttpRequest有GetResponse来同步接收一个响应，也提供了BeginGetResponse和EndGetResponse这个异步版本，而IAsynResult是二者联系的纽带，只有把BeginXXX所返回的IAsyncResult传给对应的EndXXX，EndXXX才知道需要去接收哪个BeginXXX发起的异步操作的返回值。
　　这个模式在实际使用时稍显繁琐,虽然原则上我们可以随时调用EndInvoke来获得返回值,并且可以同步多个线程,但是大多数情况下当我们不需要同步很多线程的时候使用回调是更好的选择,在这种情况下三个元素中的IAsynResult就显得多余,我们一不需要用其中的线程完结标志来判断线程是否成功完成(回调的时候线程应该已经完成了),二不需要他来传递数据,因为数据可以写在任何变量里,并且回调时应该已经填充,所以可以看到微软在新的.Net Framework中已经加强了对回调事件的支持,这总模型下,典型的回调程序应该这样写
　　a.DoWork+=new SomeEventHandler(Caculate);
　　a.CallBack+=new SomeEventHandler(callback);
　　a.Run();
　　（注：我上面讲的是普遍的用法，然而BeginXXX，EndXXX仅仅是一种模式，而对这个模式的实现完全取决于使用他的开发人员，具体实现的时候你可以使用另外一个线程来实现异步，也可能使用硬件的支持来实现异步，甚至可能根本和异步没有关系（尽管几乎没有人会这样做）-----比如直接在Beginxxx里直接输出一个"Helloworld"，如果是这种极端的情况，那么上面说的一切都是废话，所以上面的探讨并不涉及内部实现，只是告诉大家微软的模式，和框架中对这个模式的经典实现）
　　异步和多线程有什么关联
　　有一句话总结的很好：多线程是实现异步的一种手段和工具
　　我们通常把多线程和异步等同起来，实际是一种误解，在实际实现的时候，异步有许多种实现方法，我们可以用进程来做异步，或者使用线程，或者硬件的一些特性，比如在实现异步IO的时候,可以有下面两个方案:
　　1)可以通过初始化一个子线程，然后在子线程里进行IO，而让主线程顺利往下执行，当子线程执行完毕就回调
　　2)也可以根本不使用新线程，而使用硬件的支持（现在许多硬件都有自己的处理器），来实现完全的异步，这是我们只需要将IO请求告知硬件驱动程序，然后迅速返回，然后等着硬件IO就绪通知我们就可以了
　　实际上DotNet Framework里面就有这样的例子，当我们使用文件流的时候，如果制定文件流属性为同步，则使用BeginRead进行读取时，就是用一个子线程来调用同步的Read方法，而如果指定其为异步，则同样操作时就使用了需要硬件和操作系统支持的所谓IOCP的机制
　　WinForm多线程编程篇
　　我的多线程WinForm程序老是抛出InvalidOperationException ，怎么解决？
　　在WinForm中使用多线程时，常常遇到一个问题，当在子线程（非UI线程）中修改一个控件的值：比如修改进度条进度，时会抛出如下错误
　　Cross-thread operation not valid: Control ??XXX?? accessed from a thread other than the thread it was created on.
　　在VS2005或者更高版本中，只要不是在控件的创建线程（一般就是指UI主线程）上访问控件的属性就会抛出这个错误，解决方法就是利用控件提供的Invoke和BeginInvoke把调用封送回UI线程，也就是让控件属性修改在UI线程上执行，下面列出会报错的代码和他的修改版本
　　ThreadStart threadStart=new ThreadStart(Calculate);//通过ThreadStart委托告诉子线程讲执行什么方法
　　Thread thread=new Thread(threadStart);
　　thread.Start();
　　public void Calculate(){
　　double Diameter=0.5;
　　double result=Diameter*Math.PI;
　　CalcFinished(result);//计算完成需要在一个文本框里显示
　　}
　　public void CalcFinished(double result){
　　this.TextBox1.Text=result.ToString();//会抛出错误
　　}
　　上面加粗的地方在debug的时候会报错，最直接的修改方法是修改Calculate这个方法如下
　　delegate void changeText(double result);
　　public void Calculate(){
　　double Diameter=0.5;
　　double result=Diameter*Math.PI;
　　this.BeginInvoke(new changeText(CalcFinished),t.Result);//计算完成需要在一个文本框里显示
　　}
　　这样就ok了，但是最漂亮的方法是不去修改Calculate，而去修改CalcFinished这个方法，因为程序里调用这个方法的地方可能很多，由于加了是否需要封送的判断,这样修改还能提高非跨线程调用时的性能
　　delegate void changeText(double result);
　　public void CalcFinished(double result){
　　if(this.InvokeRequired){
　　this.BeginInvoke(new changeText(CalcFinished),t.Result);
　　}
　　else{
　　this.TextBox1.Text=result.ToString();
　　}
　　}
　　上面的做法用到了Control的一个属性InvokeRequired（这个属性是可以在其他线程里访问的）,这个属性表明调用是否来自另非UI线程,如果是,则使用BeginInvoke来调用这个函数,否则就直接调用,省去线程封送的过程
　　Invoke，BeginInvoke干什么用的，内部是怎么实现的?
　　这两个方法主要是让给出的方法在控件创建的线程上执行
　　Invoke使用了Win32API的SendMessage,
　　UnsafeNativeMethods.PostMessage(new HandleRef(this, this.Handle), threadCallbackMessage, IntPtr.Zero, IntPtr.Zero);
　　BeginInvoke使用了Win32API的PostMessage
　　UnsafeNativeMethods.PostMessage(new HandleRef(this, this.Handle), threadCallbackMessage, IntPtr.Zero, IntPtr.Zero);
　　这两个方法向UI线程的消息队列中放入一个消息,当UI线程处理这个消息时,就会在自己的上下文中执行传入的方法,换句话说凡是使用BeginInvoke和Invoke调用的线程都是在UI主线程中执行的,所以如果这些方法里涉及一些静态变量,不用考虑加锁的问题
　　每个线程都有消息队列吗?
　　不是,只有创建了窗体对象的线程才会有消息队列(下面给出关于这一段的描述)
　　当一个线程第一次被建立时，系统假定线程不会被用于任何与用户相关的任务。这样可以减少线程对系统资源的要求。但是，一旦这个线程调用一个与图形用户界面有关的函数（例如检查它的消息队列或建立一个窗口），系统就会为该线程分配一些另外的资源，以便它能够执行与用户界面有关的任务。特别是，系统分配一个T H R E A D I N F O结构，并将这个数据结构与线程联系起来。
　　这个T H R E A D I N F O结构包含一组成员变量，利用这组成员，线程可以认为它是在自己独占的环境中运行。T H R E A D I N F O是一个内部的、未公开的数据结构，用来指定线程的登记消息队列（posted-message queue）、发送消息队列（ send-message queue）、应答消息队列（ r e p l y -message queue）、虚拟输入队列（virtualized-input queue）、唤醒标志（wake flag）、以及用来描述线程局部输入状态的若干变量。图2 6 - 1描述了T H R E A D I N F O结构和与之相联系的三个线程。
　　为什么Winform不允许跨线程修改UI线程控件的值
　　在vs2003下,使用子线程调用ui线程创建的控件的属性是不会有问题的,但是编译的时候会出现警告,但是vs2005及以上版本就会有这样的问题,下面是msdn上的描述
　　"当您在 Visual Studio 调试器中运行代码时，如果您从一个线程访问某个 UI 元素，而该线程不是创建该 UI 元素时所在的线程，则会引发 InvalidOperationException。调试器引发该异常以警告您存在危险的编程操作。UI 元素不是线程安全的，所以只应在创建它们的线程上进行访问"
　　从上面可以看出,这个异常实际是debugger耍的花招,也就是说,如果你直接运行程序的exe文件,或者利用运行而不调试(Ctrl+F5)来运行你的程序,是不会抛出这样的异常的.大概ms发现v2003的警告对广大开发者不起作用,所以用了一个比较狠一点的方法.
　　不过问题依然存在:既然这样设计的原因主要是因为控件的值非线程安全,那么DotNet framework中非线程安全的类千千万万,为什么偏偏跨线程修改Control的属性会有这样严格的限制策略呢?
　　这个问题我还回答不好,希望博友们能够予以补充
　　有没有什么办法可以简化WinForm多线程的开发
　　使用backgroundworker,使用这个组建可以避免回调时的Invoke和BeginInvoke,并且提供了许多丰富的方法和事件
　　线程池
　　线程池的作用是什么
　　作用是减小线程创建和销毁的开销
　　创建线程涉及用户模式和内核模式的切换，内存分配，dll通知等一系列过程，线程销毁的步骤也是开销很大的，所以如果应用程序使用了完一个线程，我们能把线程暂时存放起来，以备下次使用，就可以减小这些开销
　　所有进程使用一个共享的线程池,还是每个进程使用独立的线程池?
　　每个进程都有一个线程池,一个Process中只能有一个实例，它在各个应用程序域（AppDomain）是共享的，.Net2.0 中默认线程池的大小为工作线程25个,IO线程1000个,有一个比较普遍的误解是线程池中会有1000个线程等着你去取,其实不然, ThreadPool仅仅保留相当少的线程，保留的线程可以用SetMinThread这个方法来设置，当程序的某个地方需要创建一个线程来完成工作时，而线程池中又没有空闲线程时,线程池就会负责创建这个线程,并且在调用完毕后,不会立刻销毁,而是把他放在池子里,预备下次使用,同时如果线程超过一定时间没有被使用,线程池将会回收线程，所以线程池里存在的线程数实际是个动态的过程
　　为什么不要手动线程池设置最大值?
　　当我首次看到线程池的时候,脑袋里的第一个念头就是给他设定一个最大值,然而当我们查看ThreadPool的SetMaxThreads文档时往往会看到一条警告:不要手动更改线程池的大小,这是为什么呢?
　　其实无论FileStream的异步读写,异步发送接受Web请求,甚至使用delegate的beginInvoke都会默认调用 ThreadPool,也就是说不仅你的代码可能使用到线程池,框架内部也可能使用到,更改的后果影响就非常大,特别在iis中,一个应用程序池中的所有 WebApplication会共享一个线程池，对最大值的设定会带来很多意想不到的麻烦
　　线程池的线程为何要分类?
　　线程池有一个方法可以让我们看到线程池中可用的线程数量:GetAvaliableThread(out workerThreadCount,out iocompletedThreadCount),对于我来说,第一次看到这个函数的参数时十分困惑,因为我期望这个函数直接返回一个整形,表明还剩多少线程,这个函数居然一次返回了两个变量.
　　原来线程池里的线程按照公用被分成了两大类:工作线程和IO线程,或者IO完成线程,前者用于执行普通的操作,后者专用于异步IO,比如文件和网络请求,注意,分类并不说明两种线程本身有差别,线程就是线程,是一种执行单元,从本质上来讲都是一样的,线程池这样分类,举例来说,就好像某施工工地现在有1000把铁锹,规定其中25把给后勤部门用,其他都给施工部门,施工部门需要大量使用铁锹来挖地基(例子土了点,不过说明问题还是有效的),后勤部门用铁锹也就是铲铲雪,铲铲垃圾,给工人师傅修修临时住房,所以用量不大，显然两个部门的铁锹本身没有区别，但是这样的划分就为管理两个部门的铁锹提供了方便
　　线程池中两种线程分别在什么情况下被使用,二者工作原理有什么不同?
　　下面这个例子直接说明了二者的区别,我们用一个流读出一个很大的文件(大一点操作的时间长,便于观察),然后用另一个输出流把所读出的文件的一部分写到磁盘上
　　我们用两种方法创建输出流,分别是
　　创建了一个异步的流(注意构造函数最后那个true)
　　FileStream outputfs=new FileStream(writepath, FileMode.Create, FileAccess.Write, FileShare.None,256,true);
　　创建了一个同步的流
　　FileStream outputfs = File.OpenWrite(writepath);
　　然后在写文件期间查看线程池的状况
　　string readpath = "e://RHEL4-U4-i386-AS-disc1.iso";
　　string writepath = "e://kakakak.iso";
　　byte[] buffer = new byte[90000000];
　　//FileStream outputfs=new FileStream(writepath, FileMode.Create, FileAccess.Write, FileShare.None,256,true);
　　//Console.WriteLine("异步流");
　　//创建了一个同步的流
　　FileStream outputfs = File.OpenWrite(writepath);
　　Console.WriteLine("同步流");
　　//然后在写文件期间查看线程池的状况
　　ShowThreadDetail("初始状态");
　　FileStream fs = File.OpenRead(readpath);
　　fs.BeginRead(buffer, 0, 90000000, delegate(IAsyncResult o)
　　{
　　outputfs.BeginWrite(buffer, 0, buffer.Length,
　　delegate(IAsyncResult o1)
　　{
　　Thread.Sleep(1000);
　　ShowThreadDetail("BeginWrite的回调线程");
　　}, null);
　　Thread.Sleep(500);//this is important cause without this, this Thread and the one used for BeginRead May seem to be same one
　　},
　　null);
　　Console.ReadLine();
　　public static void ShowThreadDetail(string caller)
　　{
　　int IO;
　　int Worker;
　　ThreadPool.GetAvailableThreads(out Worker, out IO);
　　Console.WriteLine("Worker: {0}; IO: {1}", Worker, IO);
　　}
　　输出结果
　　异步流
　　Worker: 500; IO: 1000
　　Worker: 500; IO: 999
　　同步流
　　Worker: 500; IO: 1000
　　Worker: 499; IO: 1000
　　这两个构造函数创建的流都可以使用BeginWrite来异步写数据,但是二者行为不同,当使用同步的流进行异步写时,通过回调的输出我们可以看到,他使用的是工作线程,而非IO线程,而异步流使用了IO线程而非工作线程
　　其实当没有制定异步属性的时候,.Net实现异步IO是用一个子线程调用fs的同步Write方法来实现的,这时这个子线程会一直阻塞直到调用完成.这个子线程其实就是线程池的一个工作线程,所以我们可以看到,同步流的异步写回调中输出的工作线程数少了一,而使用异步流,在进行异步写时,采用了 IOCP方法,简单说来,就是当BeginWrite执行时,把信息传给硬件驱动程序,然后立即往下执行(注意这里没有额外的线程),而当硬件准备就绪, 就会通知线程池,使用一个IO线程来读取
　　.Net线程池有什么不足
　　没有提供方法控制加入线程池的线程:一旦加入线程池,我们没有办法挂起,终止这些线程,唯一可以做的就是等他自己执行
　　1)不能为线程设置优先级
　　2)一个Process中只能有一个实例，它在各个AppDomain是共享的。ThreadPool只提供了静态方法，不仅我们自己添加进去的WorkItem使用这个Pool，而且.net framework中那些BeginXXX、EndXXX之类的方法都会使用此Pool。
　　3)所支持的Callback不能有返回值。WaitCallback只能带一个object类型的参数，没有任何返回值。
　　4)不适合用在长期执行某任务的场合。我们常常需要做一个Service来提供不间断的服务（除非服务器down掉），但是使用ThreadPool并不合适。
　　下面是另外一个网友总结的什么不需要使用线程池,我觉得挺好,引用下来
　　如果您需要使一个任务具有特定的优先级。
　　如果您具有可能会长时间运行（并因此阻塞其他任务）的任务。
　　如果您需要将线程放置到单线程单元中（所有 ThreadPool 线程均处于多线程单元中）。
　　如果您需要与该线程关联的稳定标识。例如，您应使用一个专用线程来中止该线程、将其挂起或按名称发现它。

分享到：

加速你的hibernate引擎

2012-01-20 01:45
浏览 328
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论