前几篇文章一直没有在源码级证明:DllMain在收到DLL_PROCESS_ATTACH和DLL_PROCESS_DETACH时会进入临界区。这个论证非常重要,因为它是使其他线程不能进入临界区从而导致死锁的关键。我构造了在DLL被映射到进程地址空间的场景,请看死锁时加载DLL的线程的堆栈(转载请指明出于breaksoftware的csdn博客)
如果仔细看过《DllMain中不当操作导致死锁问题的分析--导致DllMain中死锁的关键隐藏因子2》,应该得知第14步就是进入临界区的点。
我们可以看到LdrLoadDll内部调用了LdrLockLoaderLock。LdrLockLoaderLock内部进入临界区,我们用IDA查看LdrLoadDll函数
代码语言:javascript复制int __stdcall LdrLoadDll(int a1, int a2, int a3, int a4)
{
……
LdrLockLoaderLock(1, 0, &v10);
……
v6 = LdrpLoadDll(v9, a1, a2, v17, a4, 1);
……
if ( v8 >= 0 )
{
ms_exc.disabled = -1;
sub_7C936587(ebp0, v7);
v6 = 0;
goto LABEL_6;
}
}
int __usercall sub_7C936587<eax>(int a1<ebp>, int a2<esi>)
{
LdrpTopLevelDllBeingLoaded = a2;
return LdrUnlockLoaderLock(1, *(_DWORD *)(a1 - 572));
}
我们看到在LdrpLoadDll是在临界区中执行的。其实在LdrpLoadDll中也会进入该临界区,但是我们不必关注了。因为只要一次没出临界区就可以满足死锁的条件了。
我们再看下卸载DLL时发生的进入临界区场景,请看堆栈
我们将关注FreeLibrary和LdrpCallInitRoutine之间的代码逻辑。我们用IDA查看LdrUnLoadDll
代码语言:javascript复制int __stdcall LdrUnloadDll(int a1)
{
……
v73 = 0;
v70 = *(_DWORD *)(*MK_FP(__FS__, 24) 48);
v71 = 0;
ms_exc.disabled = 0;
if ( !LdrpInLdrInit )
RtlEnterCriticalSection(&LdrpLoaderLock);
LdrpActiveUnloadCount;
if ( !LdrpShutdownInProgress )
{
if ( LdrpCheckForLoadedDllHandle(a1, (int)&v78) )
{
if ( *(_WORD *)(v78 56) != -1 )
{
……
if ( (unsigned __int8)LdrpActiveUnloadCount <= 1u )
{
……
v15 = (int *)LdrpUnloadHead;
v77 = (int *)LdrpUnloadHead;
while ( v15 != &LdrpUnloadHead )
{
……
LdrpCallInitRoutine((int (__stdcall *)(_DWORD, _DWORD, _DWORD))v20, *(_DWORD *)(v78 24), 0, 0);
……
v15 = (int *)LdrpUnloadHead;
v77 = (int *)LdrpUnloadHead;
ms_exc.disabled = 0;
v3 = 0;
}
……
}
}
}
else
{
v71 = 0xC0000135u;
}
}
ms_exc.disabled = -1;
sub_7C937424();
……
return v71;
}
int __cdecl sub_7C937424()
{
int result; // eax@3
--LdrpActiveUnloadCount;
if ( !LdrpInLdrInit )
result = RtlLeaveCriticalSection(&LdrpLoaderLock);
return result;
}
我们看到LdrUnloadDll几乎所有操作都是在临界区执行的。
以上两段从源码级证明了加载和卸载DLL导致的DllMain的调用(以及不调用)都是在临界区中完成的。