麦克船长的 OpenRTMFP/Cumulus 原理、源码及实践 7:Cumulus 源码的一个线程启动 Bug 及修复方法

Cumulus 中的线程都是继承自 Startable,在其中封装 Poco::Thread 成员,使得一些有关线程的操作更方便。Startable 中的 start 函数如下:

void Startable::start() {
    if(!_stop) // if running
        return;
    ScopedLock
  
    lock(_mutex);
    
   if(_haveToJoin) {
        _thread.join();
        _haveToJoin=
   false;
    }
    
   try {
        DEBUG(
   "Try to start up a new thread inherited from Startable");
        _thread.start(_process);
        _haveToJoin = 
   true;
        ScopedLock
   
     lock(_mutexStop);
        _stop=
    false;
    } 
    catch (Poco::Exception& ex) {
        ERROR(
    "Impossible to start the thread : %s",ex.displayText().c_str());
    }
}

这样一个类继承 Startable 的话,并启动时传入自己,则会调用到 Startable::start(),然后调用到该类自己的 run() 函数。一般来说这个函数会一个循环,以 SocketManager 为例:

void SocketManager::run() {
     
    while(running()) {
    
    }
}

我们要看看这个 running() 是怎么回事,如下:

inline bool Startable::running() const {
    return !_stop;
}

很简单,就是通过 Startable::_stop 成员来判断是否还需要继续循环下去。那么这个 _stop 是什么时候被设置为 false 的呢?就是上面的 start(),这里存在的一个问题就是先 start 线程,再设置 _stopfalse

_thread.start(_process);
_stop=false;

start() 之后 run() 的时候就开始通过 running() 来判断 _stop 值了。所以你会在使用 Cumulus 时,发现有时候启动起来的线程个数不对。正常情况下应该有四个线程:

image

它们是:

  • 主线程
  • RTMFPServer 线程
  • MainSockets 线程
  • RTMFPManager 线程

而异常情况可能是 MainSockets 没有启动,甚至 MainSocketsRTMFPManager 都没有启动。

MainSockets 没有启动的情况,这时客户端是无法接入成功的。

image

MainSocketsRTMFPManager 都没有启动的情况 T.T

image

具体是哪个线程没有启动成功可以通过 GDB 查看。

解决办法就是将 _stop 的设置操作,在启动线程之前。不过要注意锁要同时移动,并且在产生异常时设置 _stop 值为 true

void Startable::start() {
    if(!_stop) // if running
        return;
    ScopedLock
  
    lock(_mutex);
    
   if(_haveToJoin) {
        _thread.join();
        _haveToJoin=
   false;
    }
    
   try {
        DEBUG(
   "Try to start up a new thread inherited from Startable");
        {
            ScopedLock
   
     lock(_mutexStop);
            _stop=
    false;
        }
        _thread.start(_process);
        _haveToJoin = 
    true;
    } 
    catch (Poco::Exception& ex) {
        {
            ScopedLock
    
      lock(_mutexStop);
            _stop = 
     true; 
     // June 25th, 2012, Michael@YY
        }
        ERROR(
     "Impossible to start the thread : %s",ex.displayText().c_str());
    }
}