320 likes | 492 Views
처음으로 배우는 C 프로그래밍. 제 5 부 추가적인 화제들 제 11 장 파일 처리. 파일 이란 ?. 파일이란 , 디스크에 저장되며 이름을 갖는 기억 매체의 일부분 . 연속된 바이트의 sequence 프로그램 , 데이터 , 그래픽 , 기타 여러 가지 정보를 저장 ANSI C 의 파일 처리 방식 바이너리 방식 (Binary mode) 텍스트 방식 (Text mode) 바이너리 방식 (Binary mode) 파일을 단순히 바이트의 연속으로 간주하며 , 프로그램은 각 바이트 단위로 접근
E N D
처음으로 배우는 C 프로그래밍 제5부 추가적인 화제들 제 11 장 파일 처리
파일 이란? • 파일이란, 디스크에 저장되며 이름을 갖는 기억 매체의 일부분. • 연속된 바이트의 sequence • 프로그램, 데이터, 그래픽, 기타 여러 가지 정보를 저장 • ANSI C의 파일 처리 방식 • 바이너리 방식(Binary mode) • 텍스트 방식(Text mode) • 바이너리 방식(Binary mode) • 파일을 단순히 바이트의 연속으로 간주하며, 프로그램은 각 바이트 단위로 접근 • 텍스트 방식(Text mode) • 파일이 읽혀질 때, 현재의 환경에 맞게 저장되어 있는 파일의 내용이 C가 다루는 파일의 형태에 맞도록 변환 • 파일에 어떤 내용을 쓸 때, C가 다루는 파일의 내용이 현재의 환경에 맞도록 변환되어 저장 됨
파일 이란? • 예를 들어, • MS-DOS의 텍스트 파일에서 한 라인의 끝은 캐리지 리턴(carriage - return) 문자와 라인피드(linefeed) 문자의 결합으로 표현(\r\n). • Macintosh환경에서의 텍스트 파일은 한 라인의 끝이 단지 캐리지 리턴 문자(\r)로 표현 • 그런데, C 프로그램에서 한 라인의 끝은 ‘\n’문자로 표현 • 따라서 MS-DOS의 텍스트 파일을 C 프로그램이 읽어 들일 때에는 \r\n 문자를 \n 문자로 변환 • 또한 C 프로그램이 MS-DOS환경에서 텍스트 파일을 저장하려고 할 때 \n이 \r\n으로 변환 • C 프로그램이 Macintosh의 텍스트 파일을 읽어 들일 때에는 \r이 \n문자로 변환되며, 텍스트 파일을 쓸 때에는 \n이 \r로 변환 됨
C의 기본 파일 • C 프로그램이 자동적으로 여는 3개의 파일 • 표준 입력 파일, 표준 출력 파일, 표준 오류 출력 파일 • 표준 입력 파일은 입력장치로서 보통 키보드가 됨 • 표준 입력 파일은 getchar( ), gets( ), scanf( )에 의해서 읽혀짐 • 표준 출력 파일은 출력 장치로서 보통 디스플레이 화면 됨 • 표준 출력 파일은 putchar( ), puts( ), printf( )에 의해서 사용 됨 • 표준 오류 출력 파일은 오류 메시지를 출력하는 곳으로 보통 디스플레이 화면이 됨
파일 입출력에서 버퍼 • 버퍼(Buffer)란 • 입출력의 속도를 증가 시키기 위해 사용되는 것으로서, 주기억 장치에 위치 • 파일 입출력은 버퍼(buffer)를 이용하여 수행 • 한 번에 한 바이트씩 읽고 쓰는 것이 아니라, 보다 큰 단위(보통 512 바이트 또는 그 이상)의 정보들이 이동 • 예를 들어 표준 입력 함수를 호출하면 먼저 512바이트(또는 그의 배수)의 데이터가 주 기억장치 내의 버퍼에 저장되고, 여기에서 필요한 작업이 수행 • 버퍼링(buffering)은 데이터 전송 비율을 크게 증가 시킴
“r” 읽기를 위해 텍스트 파일을 열 때 “w” 쓰기를 위해 텍스트 파일을 열 때 파일이 존재하며 파일의 크기를 0으로 만들며, 파일이 존재하지 않는 경우는 새롭게 생성한다. “a” 쓰기를 위해 텍스트 파일을 열 때 파일이 존재하면 그 파일의 끝에 덧붙이면,파일이 존재하지 않는 경우는 새롭게 생성한다. “r+” 읽거나 쓰기 위해 텍스트 파일을 열 때 “w+” 읽거나 쓰기를 위해 텍스트 파일을 열 때 파일이 존재하며 파일의 크기를 0으로 만들며, 파일이 존재하지 않는경우는 새롭게 생성한다. “a+” 읽거나 쓰기를 위해 텍스트 파일을 열 때 파일이 존재하면 그 파일의 끝에 덧붙이면,파일이 존재하지 않는 경우는 새롭게 생성한다. 읽기를 위해서는 파일의 전체가 접근 가능하나 쓰기는 파일의 끝에 덧붙이는 것만 가능하다. 파일 열기 • fopen( ) • 파일을 열 때 사용되는 함수 • 첫번째 인자는 열고자 하는 파일의 이름 • 두 번째 인자는 파일을 열 때 어떤 방식으로 여는지를 지정하는 문자열 • 문자열이 나타내는 의미 * “rb”, “wb”, “ab”, ”rb+”, “r+b’, ”wb+”, ”w+b”, ”ab+”, “a+b” : 텍스트 방식이 아니라 바이너리 방식에 해당된다. [주의] 존재하는 파일에 대하여 “w”를 사용하면 그 파일이 내용이 지워진다.
표준 화일 파일 포인터 표준 입력 파일 stdin 표준 출력 파일 stdout 표준 오류 출력 파일 stderr 파일 열기 • 파일을 성공적으로 열고 나면, fopen( )함수는 파일 포인터(File Pointer)를 반환. • 파일 포인터를 이용하여 다른 입출력 함수들이 파일에 접근 • 파일 포인터는 FILE이라는 데이터형을 사용하여 선언되는데 이는 <stdio.h>에 정의되어 있음 예) FILE *fp; • fopen( )함수가 성공적으로 파일을 열지 못했을 경우에는 NULL 포인터를 반환 • fopen( )함수가 실패하는 경우는, 디스크의 용량이 부족할 때, 파일의 이름이 부적당할 때, 그 파일의 대한 접근 권한이 없을 때 등. • C 프로그램에 의해서 자동적으로 열리는 3개의 표준 파일들은, 그에 해당하는 파일 포인터가 지정됨
파일 열기 예제 [예제 11.1] #include<stdio.h> void main(void) { FILE *in_file; char f_name[13]; printf("\f2 nEnter a file name: "); gets(f_name); in_file = fopen(f_name,"r"); /* open the file */ if(in_file == NULL) { printf("\f2 nThe file cannot be opened."); printf("\f2 nPlease check that the file currently exists."); exit(1); } printf("\f2 nThe file has been successfully opened for reading:"); } [실행 결과] Enter a file name: prices.bnd The file has been successfully opened for readin
파일 닫기 • fclose(fp) • 파일 포인터 fp가 가리키는 파일을 실제로 닫는 일을 수행 • 성공적으로 수행되면 0이 반환되며, 실패했을 경우에는 -1이 반환 • fclose(in_file); • in_file이라는 포인터 변수로 참조된 파일을 닫음 • fclose()에 넘겨지는 인자는 반드시 파일이 열릴 때 사용된 포인터 이름이어야 함
파일 출력 • fputc(int *c, FILE *fout) • 파일 포인터 fout이 가리키는 파일에 문자 c를 출력 • [주의] putchar( ) 함수는 표준 출력 파일에 문자 하나를 출력 putchar(ch); fputc(ch, stdout); • fputs(char *buf, FILE *fp) • 첫번째 인자인 buf는 문자열이 저장되어 있는 주소 • 두 번째 인자인 fp는 문자열이 쓰여질 파일에 대한 포인터 • puts( )와는 달리 fputs( )함수는 문자열을 출력할 때 개행 문자를 덧붙이지 않음 • fprintf(filename,"format",args ) • 첫번째 인자로 파일 포인터가 더 필요하다는 것을 제외하고는 printf( )와 비슷하게 동작
파일 출력 예제 [예제 11.2] #include <stdio.h> void main(void) { int i; FILE *out_file; /* FILE 선언 */ float price[] = 39.95, 3.22, 1.03; /* 가격의 리스트 */ /* 물품의 리스트 */ char *descrip[] = {"Batteries", "Bulbs", "Fuses”}; out_file = fopen("prices.dat" , "w"); /* 파일 열기 */ if(out_file == NULL) { printf("\f2 nFailed to open the file."); exit(1); } for(i=0; i<3; I++) fprintf(out_file, "%-9s %5.2f", descrip[i], price[i]); fclose(out_file); }
파일 출력 예제 실행결과 [실행결과 11.2] prices.dat화일, 아래는 실제 저장된 모양 Batteries 39.95 Bulbs 3.22 Fuses 1.03 42 61 74 74 65 72 69 65 73 20 33 39 2e 32 35 0a 42 75 6c 62 73 B a t t e r I e s 3 9 . 2 5 B u l b s 20 20 20 20 20 20 33 2e 32 32 0a 46 75 73 65 73 20 20 20 20 20 3 . 2 2 F u s e s 20 31 2e 30 33 0a 26 1 . 0 3 ^z 컴퓨터에 의해 저장된 prices.dat 파일
파일로부터 입력 • 파일 읽기 함수 • fgetc(filename) • filename으로부터 한 글자를 입력 • fgets(stringname, n, filename) • filename으로부터 n-1개의 글자를 읽어서 stringname에 저장 • fscanf(filename, "format", &args) • format에 따라 filename으로부터 자료를 읽어 args에 저장
파일로부터 입력 • fgetc(fp) • 파일 포인터 fp가 가리키는 파일로부터 문자 하나를 읽어 들이는 함수 예) ch = getc(fp); [주의] getchar( ) 라는 함수는 표준 입력 파일로부터 문자 하나를 입력 ch = getchar(); ch = getc(stdin);
파일로부터 입력 • fgets(char *buf, int MAX, FILE *fp) • 첫번째 인자인 buf는 읽어 들인 문자열이 저장될 주소 • 두 번째 인자인 MAS는 읽어 들인 문자열의 최대 크기 • fgets( ) 함수는 MAX-1개의 문자를 읽어 들인 후 마지막에 ‘\0’문자를 추가 • 세 번째 인자인 fp는 읽어 들일 문자열이 있는 파일에 대한 포인터 • 함수는 읽어 들인 문자의 개수가 최대의 크기를 넘기 전에 첫번째 개행문자를 만나거나 파일의 끝을 만나면 읽기를 멈춤 • 함수가 gets( )과 다른 점은, 문자열을 읽어 들인 후 마지막으로 ‘\0’문자를 추가 • 반면에 fgets( )함수는 개행 문자를 읽으면 이것을 없애 버림 • gets( )와 마찬가지로 fgets( ) 함수도 EOF 문자를 만나면 NULL 을 반환 • 이것을 이용하여 파일의 끝에 도달하였는지를 검사
파일로부터 입력 • fscanf( ) • 첫번째 인자로 파일 포인터가 더 필요하다는 것을 제외하고는 scanf( )와 비슷하게 동작 [예제 11.3] #include <stdio.h> void main(void) { char descrip[10]; float price; FILE *in_file; in_file = fopen("prices.dat", "r"); if(in_file == NULL) { printf("\f2 nFailed to open the file."); exit(1); } while(fscanf(in_file, "%s %f", descrip, &price)!= EOF) printf("%-9s %5.2f", descrip, price); fclose(in_file); }
파일로부터 입력 예제 [예제 11.4] #include <stdio.h> void main(void) { char line[81], descrip[10]; float price; FILE *in_file; in_file = fopen("prices.dat", "r"); if(in_file == NULL) { printf("\f2 nFailed to open the file."); exit(1); } while(fgets(line, 81, in_file) != NULL) printf("%s", line); fclose(in_file); }
파일로부터 입력 예제 • 프로그램 11-4는 파일로부터 한 행의 문장을 읽어서 터미널로 출력하는 행 단위의 문장 복사 프로그램 • 따라서 프로그램 11-4의 출력은 프로그램 11-3과 동일 • 만일 목록과 가격을 각각의 다른 변수에 할당하려면 프로그램 11-3을 이용하거나 혹은 프로그램 11-4에서 fgets()함수에 의해 반환되는 문자열을 문자열 입력 함수인 sscanf()로 처리해야 한다. • 예를 들어, sscanf(line, "%s %f", descrip, &price ); • 위 문장은 배열 line으로부터 목록과 가격을 추출(9장 4절의 메모리상의 문자열 포맷을 참조)
gets( )와 fgets( )의 비교 • fgets( )는 예제에서처럼 오버플로우(overflow)를 일으키지 않으므로, gets( ) 보다 더 안전 • fgets( )은 개행문자를 읽어 들이며, puts( )은 개행문자를 출력할 문자열에 덧붙인다. • 따라서 fgets( ) 함수는 puts( )와 같이 쓰지 말고 개행문자를 덧붙이지 않는 fputs( )와 같이 써야 함
표준 입/출력 파일 • 논리적 파일 포인터 외에 C 프로그램은 물리적 파일 포인터(physical file pointer)를 제공 • 키보드(keyboard), 스크린(screen), 프린터(printer) • 표준 입력 파일 • 자료 입력을 위해 프로그램에 실제의 물리적 장치를 할당한 것 • 내부 파일 포인터 stdin • scanf() 함수 = 키보드 • 표준 출력 파일 • 자료 출력을 위해 프로그램에 실제의 물리적 장치를 할당한 것 • 내부 파일 포인터 stdout • printf() 함수 = CRT 스크린 또는 프린터
입/출력 함수의 대응 함수 일반 형태 putchar(character) fputc(character, stdout) puts(string) fputs(string, stdout) getchar() fgetc(stdin) gets(stringname) fgets(stringname, n, stdin)
랜덤 파일 접근 • 대부분의 파일들은 순차적 방법을 사용하여 구성. • 문자들이 차례대로 잇달아 저장되어 있다는 것을 의미. • 파일을 읽을 때도 순차적인 방법을 사용. • 문자들이 파일에 순차적으로 저장되어 있다고 해서 파일을 순차적인 방법에 의해서만 접근할 수 있는 것은 아님. • 표준 라이브러리 함수 rewind(), fseek(), ftell()은 파일을 랜덤하게 접근(random access)할 수 있도록 해줌
랜덤 파일 접근 • rewind() 함수는 현재의 위치를 파일의 시작점 위치로 옮김 • fseek( ) • fseek( )함수는, fopen( )을 이용하여 연 파일을 배열처럼 사용할 수 있도록 함으로써 어떤 특정 바이트에 직접 접근할 수 있도록 해 줌 • fseek( )함수의 첫번째 인자는 파일 포인터 • 두 번째 인자는 오프셋(offset)으로서 파일의 현재 시작점으로부터 얼마나 떨어져 있는가를 표현 • 이 인자는 데이터 형은 long 이어야 하며, 양수인 경우는 시작점으로부터 뒤쪽으로 이동하며, 음수인 경우는 시작점으로부터 앞쪽으로 이동. 예) fseek(fp, -count, SEEK_END);
모드 시작점 SEEK_SET 파일의 시작 SEEK_CUR 현재의 위치 SEEK_END 파일의 끝 랜덤 파일 접근 • 세 번째 인자는 기준점을 의미 예) fseek(fp, OL, SEEK_END); • 성공적으로 수행되면 0을 반환하며, 파일의 경계를 넘어서는 곳으로 이동하려고 하는 등의 오류가 발생하면 -1을 반환 • ftell( ) • 파일에서의 현재 위치를 반환하는 함수 • 파일의 첫번째 바이트를 0으로 해서, 파일에서의 현재 위치가 시작점으로부터 몇 바이트 떨어져 있는지를 반환 • 반환 값은 long 데이터형의 정수 예) last = ftell(fp);
랜덤 파일 접근 예제 [예제 11.5] 파일의 내용을 거꾸로 읽는 프로그램 #include <stdio.h> void main(void) { int ch, n; long int offset, last; FILE *in_file; in_file = fopen("test.dat","r"); if ( in_file == NULL ) { printf("\f2 nFailed to open the test.dat file."); exit(1); } fseek(in_file, 0L, SEEK_END); /* 파일의 끝으로 파일 포인터를 이동 */ last = ftell(in_file) /* 마지막 문자의 오프셋을 저장 */ for(offset = 0; offset <= last; ++offset) { fseek(in_file, -offset, SEEK_END); /* 뒤로부터 다음 문자로 이동 */ ch = getc(in_file); /* 문자를 읽어옴 */ switch(ch) { case '' : printf("LF : "); break; case EOF : printf("EOF : "); break; default : printf("%c : ",ch); break; } } fclose(in_file); }
랜덤 파일 접근 예제 • 프로그램 11-5는 처음에 파일의 마지막 문자로 이동 • 마지막 문자의 오프셋은 EOF 문자의 위치를 의미하며, 이것은 last 변수에 저장 • ftell() 함수가 long 형을 반환하므로, last 변수도 long 형으로 선언 • ftell()함수의 원형은 헤더 파일 stdin.h에 포함 • 파일의 끝에서부터 시작해서 거꾸로 문자를 읽어 들이는데 fseek() 함수가 사용되었다. 각각의 문자들이 읽혀지면서 화면에 출력되고, 오프셋은 다음 문자를 읽을 수 있도록 조정되어 짐 • 파일 test.dat가 다음의 자료를 저장하고 있다고 가정 Bulbs 3.12 • 그러면, 프로그램 11-5의 출력은 다음과 같다. EOF : 2 : 1 : . : 3 : : : : s : b : l : u : B :
파일명 전달과 반환 • 파일 이름을 함수에 전달하는 방법 • 함수에 인자를 전달하는 방법과 같은 방법으로 진행. • 파일 이름을 전달하기 위해서는 FILE 구조체의 포인터가 전달될 수 있도록 선언하는 것이 필요. [예제 11.6] #include <stdio.h> void main(void) { FILE *out_file; void in_out(FILE *); /* 함수 원형 */ out_file = fopen("prices.dat","w"); if ( out_file == NULL ) { printf("\f2 nFailed to open the file. "); exit(1); } in_out(out_file); fclose(out_file); } void in_out(FILE *fname) /* fname이 FILE 포인터이다 */ { int count; char line[81]; printf("Please enter five lines of text :"); for( count=0; count < 5; ++count) { gets(line); fprintf(fname, "%s",line); } return; }
파일명 전달과 반환 [예제 11.7] #include <stdio.h> void main(void) { FILE *out_file; FILE *get_open(void); /* 함수 원형 */ void in_out(FILE *); /* 함수 원형 */ out_file = get_open(); in_out(out_file); fclose(out_file); } /* get_open()함수는 FILE 포인터를 반환한다. */ FILE *get_open(void) { FILE *fname; char name[13]; printf("\f2 nEnter a file name: "); gets(name); fname = fopen(name,"w"); if( fname == NULL ) { printf("\f2 nFailed to open the file %s.", name); exit(1); } return (fname); }
범하기 쉬운 프로그래밍 오류 • 파일을 접근할 때 내부적인 파일 포인터를 사용할 자리에 파일의 외부적인 이름을 사용. • 파일의 외부적인 이름을 사용하는 유일한 표준 함수는 fopen() 함수 뿐이다. 그밖에 이 장에서 나온 모든 표준 함수는 파일을 처음 열 때 파일을 가리키는 포인터 변수를 사용. • 파일의 포인터 이름을 전혀 쓰지 않을 때 • 프로그래머들이 표준 입출력 장치를 접근하는 함수를 사용할 때 특별한 파일 포인터를 쓰지 않기 때문에, 때때로 자료 파일을 엑세스 할 때도 파일 포인터를 넣는 것을 잊어버리곤 한다. • 파일의 끝을 표시하는 EOF를 사용할 때 발생 • EOF를 받아들일 임의의 변수는 정수형으로 선언되어야 하며, 문자형 변수로 선언되어서는 안 된다. 예를 들면, 만약에 ch라는 변수가 문자형으로 선언되어 있다고 하면, 다음의 수식은 무한히 반복될 것이다. 이것은 문자형 변수는 EOF 코드를 가질 수 없기 때문이다 while ( ( ch = getc(in_file) ) != EOF ) • fseek() 함수에 넘겨주는 오프셋 인자 • 이 오프셋은 long 형 상수나 변수이어야 한다. 그렇지 않고 다른 자료형이 전달되었을 때는 예상치 못한 결과가 나올 수 있다.
요 약 1. 자료 파일은 공통된 이름 하에 외부 기억장치에 저장되어 있는 자료들의 모음 2. 자료 파일은 fopen() 표준 라이브러리 함수를 이용하여 열린다. 이 함수는 파일의 외부적인 이름을 내부적인 포인터 이름과 연결시켜 준다. 열려진 파일을 접근하기 위한 모든 표준 라이브러리 함수는 내부적인 포인터 이름을 이용한다. 3. 파일은 읽기, 쓰기, 첨가하기 등의 목적으로 열릴 수 있다. 쓰기 모드로 파일을 열면 새로운 파일이 만들어진다. 특히, 열려진 파일과 똑같은 이름을 가진 파일이 존재하면 기존 파일 내용은 모두 지워진다. 파일을 첨가 모드로 열면, 자료는 파일의 끝에서부터 추가된다. 특히 첨가 모드로 파일을 여는 경우 파일이 존재하지 않으면 새로운 파일이 생성된다. 읽기 모드로 파일을 열면 이미 존재하는 파일의 자료를 입력으로 사용할 수 있다. 4. 내부적인 파일의 이름은 반드시 FILE 구조체의 포인터형으로 선언되어야 한다. FILE *f_name;
요 약 5. 함수 안에서 파일이 열리는 것 외에도 프로그램이 실행될 때 표준 파일 stdin, stdout, stderr이 자동적으로 열린다. stdin은 scanf()함수에 자료 입력을 위해 사용되는 물리적인 파일의 포인터 이름이다. stdout은 printf() 함수에 의해 자료가 출력되는 물리적인 파일 장치의 포인터 이름이다. 그리고 stderr은 시스템 오류 정보를 출력하기 위한 물리적인 파일 장치의 포인터 이름이다. 6. 자료 파일은 rewind(), fseek(), ftell() 함수들을 사용함으로써 랜덤 접근이 가능
표준 파일 라이브러리 함수 함수명 목적 fopen()파일 열기 혹은 생성 fclose()파일 닫기 fgetc()문자 입력 getchar()stdin로부터 문자 입력 fgets()문자열 입력 gets() stdin으로부터 문자열 입력 fscanf()형식화된 입력 scanf()stdin로부터 형식화된 입력 fputc()문자 출력 putchar()stdout에 문자 출력 fputs()문자열 출력 puts() stdout에 문자열 출력 fprintf()형식화된 출력 printf()stdout에 형식화된 출력 fseek()특정 파일 위치 선택 rewind() 파일 시작 위치 선택 ftell()파일 위치 보고