GO语解惑:从源码分析GO程序的入口

起因

最近几天学完了GO语言,但是教材里给出的信息太少,不能满足需要。于是在网上看了许多博文,这就发现其中有许多冲突之处,使人越发迷惑。为了解惑,我深入分析了一下GO语言而小有心得,想把其中的一些分享给大家,希望能提高大家的学习效率。


GO语言的真正入口

GO语言的runtime.Caller方法会提供当前goroutine的栈上的函数调用信息,主要有当前的PC值和调用的文件和行号。若无法获得信息,第四个返回的值为false。当我们在main.main里使用这个函数(本函数为转载):

func main() {
    for skip := 0; ; skip++ {
        pc, file, line, ok := runtime.Caller(skip)
        if !ok {
            break
        }
        fmt.Printf("skip = %v, pc = %v, file = %v, line = %v\n", skip, pc, file, line)
    }
    // Output:
    // skip = 0, pc = 4198453, file = caller.go, line = 10
    // skip = 1, pc = 4280066, file = $(GOROOT)/src/pkg/runtime/proc.c, line = 220
    // skip = 2, pc = 4289712, file = $(GOROOT)/src/pkg/runtime/proc.c, line = 1394
}

根据这里的显示入口是:runtime.goexit -> runtime.main -> main.main 。

这不合常理啊!通过分析runtime.goexit的代码,无法确认它调用runtime.main。后来又看到有人讲GO语言的入口在src/lib9/main.c。所以我认为有必要分析一下源码,找出它真正的入口,因为我太疑惑了。


从链接器源码开始

链接器是最终生成可执行文件的工具,我们如果要查看入口,就从它开始。本人使用的是32bit windows 1.21版的GO安装包,所以就从8l的代码开始。首先定位到它的main函数:GO/src/cmd/8l/obj.c/main,具体细节不表,在这里它调用了libinit。libinit的最后几行是关键:

if(INITENTRY == nil) {
		INITENTRY = mal(strlen(goarch)+strlen(goos)+20);
		if(!flag_shared) {
			sprint(INITENTRY, "_rt0_%s_%s", goarch, goos);
		} else {
			sprint(INITENTRY, "_rt0_%s_%s_lib", goarch, goos);
		}
	}
	lookup(INITENTRY, 0)->type = SXREF;

函数的真正入口就是这个INITENTRY,在我的版本上它被指向GO/src/pkg/runtime/rt0-windows_386.s。在这个libinit之后,INITENTRY被放在HASH表然后又DUMP到可执行文件这些细节跟主题无关,可能有很多人对此有兴趣,但这里我也就不表了。


汇编入口

PLAN9格式的汇编语言,GO/src/pkg/runtime/rt0_windows_386.s内容如下:

TEXT _rt0_386_windows(SB),NOSPLIT,$12

MOVL 12(SP), AX

LEAL 16(SP), BX

MOVL AX, 4(SP)

MOVL BX, 8(SP)

MOVL $-1, 0(SP) // return PC for main

JMP main(SB) //这个main在哪里呢?就在下面!


TEXT main(SB),NOSPLIT,$0

JMP _rt0_go(SB) //这个_rt0_go在哪里?

继续转到GO/src/pkg/runtime/asm_386.s:

TEXT _rt0_go(SB),NOSPLIT,$0

// copy arguments forward on an even stack

MOVL argc+0(FP), AX

MOVL argv+4(FP), BX

SUBL $128, SP // plenty of scratch

ANDL $~15, SP

MOVL AX, 120(SP) // save argc, argv away

MOVL BX, 124(SP)

// set default stack bounds.

// _cgo_init may update stackguard.

MOVL $runtime·g0(SB), BP

LEAL (-64*1024+104)(SP), BX

MOVL BX, g_stackguard(BP)

MOVL BX, g_stackguard0(BP)

MOVL SP, g_stackbase(BP)

// find out information about the processor we're on

MOVL $0, AX

CPUID

CMPL AX, $0

JE nocpuinfo

MOVL $1, AX

CPUID

MOVL CX, runtime·cpuid_ecx(SB)

MOVL DX, runtime·cpuid_edx(SB)

nocpuinfo:


// if there is an _cgo_init, call it to let it

// initialize and to set up GS.  if not,

// we set up GS ourselves.

MOVL _cgo_init(SB), AX

TESTL AX, AX

JZ needtls

MOVL $setmg_gcc<>(SB), BX

MOVL BX, 4(SP)

MOVL BP, 0(SP)

CALL AX

// update stackguard after _cgo_init

MOVL $runtime&middot;g0(SB), CX

MOVL g_stackguard0(CX), AX

MOVL AX, g_stackguard(CX)

// skip runtime&middot;ldt0setup(SB) and tls test after _cgo_init for non-windows

CMPL runtime&middot;iswindows(SB), $0

JEQ ok

needtls:

// skip runtime&middot;ldt0setup(SB) and tls test on Plan 9 in all cases

CMPL runtime&middot;isplan9(SB), $1

JEQ ok


// set up %gs

CALL runtime&middot;ldt0setup(SB)


// store through it, to make sure it works

get_tls(BX)

MOVL $0x123, g(BX)

MOVL runtime&middot;tls0(SB), AX

CMPL AX, $0x123

JEQ ok

MOVL AX, 0 // abort

ok:

// set up m and g "registers"

get_tls(BX)

LEAL runtime&middot;g0(SB), CX

MOVL CX, g(BX)

LEAL runtime&middot;m0(SB), AX

MOVL AX, m(BX)


// save m->g0 = g0

MOVL CX, m_g0(AX)


CALL runtime&middot;emptyfunc(SB) // fault if stack check is wrong


// convention is D is always cleared

CLD


CALL runtime&middot;check(SB)


// saved argc, argv

MOVL 120(SP), AX

MOVL AX, 0(SP)

MOVL 124(SP), AX

MOVL AX, 4(SP)

CALL runtime&middot;args(SB)

CALL runtime&middot;osinit(SB)

CALL runtime&middot;hashinit(SB)

CALL runtime&middot;schedinit(SB)


// create a new goroutine to start program

PUSHL $runtime&middot;main&middot;f(SB) // entry

PUSHL $0 // arg size

ARGSIZE(8)

CALL runtime&middot;newproc(SB)

ARGSIZE(-1)

POPL AX

POPL AX


// start this M

CALL runtime&middot;mstart(SB)


INT $3

RET


DATA runtime&middot;main&middot;f+0(SB)/4,$runtime&middot;main(SB)

GLOBL runtime&middot;main&middot;f(SB),RODATA,$4


反汇编验证

随便编译一个GO程序,用W32ASM验证一下。

200419560 sub esp, 0000000C


:00419563 mov eax, dword pt: [esp+0C]

:O0419$67 lea ebx, dword ptr [esp+10]

:00419$6B mov dword pct [esp+04], eax

:0041956F mnv dword pt: [esp+08], ebx

:00419S73 mov dword ptr [esp], FFFFFFFF

:00419$7A jmp test.00419S80

.......

:00417C90 mov eax, dword pt: [esp+04]

:0O417C94 mov ebx, dword pct [esp+08]

200417098 sub esp, 00000080

:00417C9E and esp, FFFFFFFO

:00417CA1 mov dword ptr [esp+78], eax

:0O417CA9 mov ebp, 00447300

:00417CAE lea ebx, dword pt: [esp-0000FF98]

:00417CB5 mov dword pt: [ebp+40], ebx

:00417CB8 mov dword pt: [ebp+00], ebx

:0O417CBB mov dword pct [ebp+O4], esp

上面是rt0_windows_386.s部分,下面是asm_386.s部分。对比可知,这才是GO程序的真正入口。

本文来自:开源中国博客

感谢作者:sz_Promi

查看原文:GO语解惑:从源码分析GO程序的入口

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。