Linux应用经验技巧:Linux用Nasm巧汇编

发表于:2007-05-26来源:作者:点击数: 标签:
随着 Linux 的普及,如何在Linux平台下进行编程,尤其是汇编成为大家关注的一个问题,但是这方面资料却很少。在遍访网站和论坛后,我把收集到的资料结合本人总结的一些经验跟大家分享一下。 Nasm介绍 Linux下的汇编编译器有多种,语法也不尽相同,其中GAS是
随着Linux的普及,如何在Linux平台下进行编程,尤其是汇编成为大家关注的一个问题,但是这方面资料却很少。在遍访网站和论坛后,我把收集到的资料结合本人总结的一些经验跟大家分享一下。

Nasm介绍

Linux下的汇编编译器有多种,语法也不尽相同,其中GAS是比较基本的汇编工具。但是GAS采用的不是我们通常在DOS体系下使用的汇编语法,它采用的是AT&T的语法格式,这是继承Unix的特点,与Intel语法格式有很大的不同。

作为一个从DOS转型到Linux的汇编爱好者,AT&T的格式不太容易接受,学习起来也非常困难。我要介绍的是另一种汇编工具Nasm,这跟DOS下用的Intel x86汇编风格的Masm类似,是Linux中语法与DOS最为相像的一种汇编工具。

下面就以hello.asm这个小程序为例,介绍如何用Nasm在Linux下进行汇编。

hello.asm
            hello world for Linux
            section .text
            extern puts
            global main
            main:
            push dword msge ;
            call puts ;
            add  esp, byte 4 ;
            ret ;
            msge:
            db “Hello World!”,0

Nasm编译命令如下:

 

Nasm -f elf hello.asm
            gcc -o hello hello.o

“Nasm -f elf hello.asm”是将把hello.asm汇编成elf object文件。“gcc -o hello hello.o”会把hello.asm汇编成二进制可执行文件hello.com 。

Nasm -f命令的参数主要有aout和elf两种,如果不能确定Linux系统应该用aout还是elf,可以在Nasm目录中输入命令file Nasm,如果输出“Nasm: ELF 32-bit LSB executable i386(386 and up) Version 1”应该使用elf;如果输出“Nasm: Linux/i386 demand-paged executable(QMAGIC) ”应该使用aout。用命令Nasm -h可以取得Nasm命令行的完整说明。

程序说明

hello.asm是调用了Linux系统的puts函数,原理与调用DOS下C语言的函数相同,先用extern声明puts是外部函数,再把参数(即msg的地址)压入堆栈,最后call函数实现输出。 再来看一个程序:

section .text
            global main
            main:
            mov eax,4 ;     4号调用
            mov ebx,1 ;     ebx送1表示输出
            mov ecx,msge ;  字符串的首地址送入ecx
            mov edx,14 ;    字符串的长度送入edx
            int 80h ;       输出字串
            mov eax,1 ;     1号调用
            int 80h ;       结束
            msge:
            db “Hello World!”,0ah,0dh

这个程序与DOS程序十分相似,而且结果同hello.asm一样,它用的是Linux中的80h中断,相当于DOS下的21h中断,只是因为Linux是32位操作系统,所以采用了eax、ebx等寄存器。

Nasm与Masm的区别

1.大小写问题

与Linux系统一样,Nasm是区分大小写的,Hello与hello将是不同的标识符。而在DOS或OS/2下使用Masm进行汇编,需要加入UPPERCASE参数才能区分大小写。

2.对[ ]的使用

Nasm对[ ]的使用与Masm也有所不同,Nasm规定所有的表达式和内存操作数都必须写在[ ]中。下面举两个例子来说明。

Masm的语法:

 

mov ax,bar
            mov ax,es:[di]
            mov ax,[di]+1

Nasm的语法:

 

mov ax,[bar]
            mov ax,[es:di]
            mov ax,[di+1]

3.关于变量类型

Nasm中不存储变量类型,Masm中即使是通过[ ]寻址方式的变量也必须要指定变量类型。Nasm中不支持LODS, MOVS、STOS、SCAS、CMPS、INS、OUTS等类型,只支持lodsb、lodsw等已经指定类型的操作,并且Nasm中不再有assume操作,段地址完全取决于存入段寄存器的值。

关于Nasm详细的使用方法及语法还可以参阅Nasm使用手册。

小结

Linux作为一个多用户的操作系统,与DOS有着非常大的区别的,特别涉及到操作系统原理时,与DOS可以说是截然不同。Linux操作系统实际是从抽象资源操作到具体硬件操作之间的接口。

对Linux这样的多用户操作系统来说,它需要避免用户对硬件的直接访问,并防止用户之间的互相干扰,所以Linux接管了BIOS调用和端口输入输出,如果要通过Linux对硬件进行访问就需要用到SystemCall。它实际上是许多C函数的集合,可以在汇编程序中被调用,调用方法与DOS下的汇编完全相同,并且用Nasm汇编时不用链接额外的库函数。

原文转自:http://www.ltesting.net