メインメニューを開く

ポインタ (プログラミング)

ポインタ (pointer) とは、あるオブジェクトがなんらかの論理的位置情報でアクセスできるとき、それを参照する(指し示す)ものである。有名な例としてはC/C++でのメモリアドレスを表すポインタが挙げられる。

なお、C++では、さらに独立した「参照」という機能がある(#参照の節を参照)。

C言語のポインタ編集

最も典型的なポインタの例としては、C言語におけるポインタが挙げられる。C言語のポインタは「特定のメモリ領域を指し示す」ものである。ポインタを経由してメモリ上のデータにアクセスする際、参照するデータの型に応じたポインタ型を用いる。たとえば、int型のデータにアクセスする場合は、int*型を用いる。これを「intへのポインタ」(pointer to int[1]) と呼ぶ。

C言語にポインタが存在する理由は、効率上の問題である。C言語は、元々UNIXを記述するシステム用言語として開発されたものである。したがって、アセンブラが実行できる操作のほぼ全てを行える必要があった。そのため、特定のメモリ領域への値の直接代入能力を持つなど、他のプログラミング言語と比較して、むしろ異例とも言える強力なポインタ機能を備えている。

C言語の実行モデルでは、実行プログラム上の関数コード、データが全て1次元のアドレスに直列配置される。そのため、データはおろか、関数のアドレスを取得し、他の関数にエントリーポイント情報として渡すこともできる。

また、C言語の関数では、引数は、値渡しだけをサポートし、参照渡しをサポートしない。これは、アドレスの数値を取得すれば、参照に可能な全てを行えるため、実質的に参照を数値と同一視できるからである。実際、初期のC言語では、アドレス値は、整数型互換するものとして扱われていた。これは、値と参照を明確に区別するPascalなどとは対照的である。現在[いつ?]でもC言語は、void*により任意のメモリ領域にアクセスできる。なお後発のC++では参照渡しもサポートするようになった。

しかし、コード領域も含むメモリを直接扱えるということは、言語レベルでは(意図的でないとしても)不正なメモリアクセスを事実上保護できないということを示しており、C言語のプログラムにおけるポインタ関連のバグの多さがそれを証明している。

実際の例編集

一般的なC言語のソースコードでは、ポインタが指している領域の値を参照する間接演算子 (indirection operator) "*"と、アドレス演算子 (address operator) "&"を用いて記述される。未初期化のポインタ変数は、不定の領域を指している。しかし、その場合、「未初期化状態」と「有効な領域を指している状態」の区別がつかない。そのため、Null(ヌル)値を代入することによって、ポインタが無効な領域を指していることを明示する必要がある。

単純なポインタ編集

  • 宣言例
int n;
/* int型へのポインタである、ポインタ型変数 ptr を宣言 */
int *ptr;
/* int型変数 n へのポインタを代入 */
ptr = &n;

C言語の処理系では通例、無効なポインタを示す値として下記のようなNULLマクロが定義されている。

#define NULL ((void*)0)

C言語では、voidへのポインタは任意の型へのポインタに自由に代入することができる。ポインタに無効値を代入する場合、通例このNULLマクロを使う。

int *ptr = NULL;

一方、C++では、NULLは整数定数のゼロに等しい。

#define NULL 0

そのため、C++では下記のように書くこともできる。

int *ptr = 0;

C++ではNULLが整数定数のゼロに等しいことから起こる関数オーバーロードのルックアップに関する問題を解決するため、C++11以降では、std::nullptr_t型として評価されるキーワードnullptrが定義された。

int *ptr = nullptr;
  • 利用例

下記はポインタptrの参照先である変数nに整数値10を代入することになる。

int n = 0;
int *ptr = &n;
*ptr = 10;
printf("%d\n", n); /* 10 */
  • 配列とポインタ

C言語における配列(固定長配列)とポインタはそれぞれ異なるデータ型であるが、配列の添え字演算子は、ポインタの加減算とデリファレンスの糖衣構文である。

double a[10];
int i;
for (i = 0; i < 10; ++i) {
    const double x = i * 0.1;
    /* 以下はともに同じ意味を持つ。 */
#if 1
    a[i] = x;
    printf("%f\n", a[i]);
#else
    *(a + i) = x;
    printf("%f\n", *(a + i));
#endif
}

実行時に要素数の決まる配列を作成する際など、動的にメモリ領域を確保するときは結果をポインタで受け取る。確保したメモリを解放するときもポインタを利用する。メモリ解放直後のポインタは無効な領域を指しており、これを「ダングリングポインタ」(dangling pointer) と呼ぶ。ダングリングポインタが指している領域を誤って使用することのないように、セキュリティ対策として明示的にNULLを代入しておく手法が推奨されている[2]

int i;
int *ptr = malloc(sizeof(int) * 10);
for (i = 0; i < 10; ++i) {
  ptr[i] = i;
}
free(ptr); /* 解放により ptr はダングリングポインタとなる。 */
ptr = NULL;
  • 関数の引数

C言語の関数は前述のように参照渡しをサポートせず、値渡しのみをサポートするため、出力は戻り値(返り値)による1つのみを持つことしかできないが、ポインタを利用することで疑似的に複数の出力を持つ関数を定義することが可能となる。

/* xはdouble型配列へのポインタであり、const double *xと宣言することもできる。 */
double func(const double x[], int num, double *minVal, double *maxVal) {
  int i;
  double sum = 0.0;
  assert(num > 0);
  *minVal = +DBL_MAX;
  *maxVal = -DBL_MAX;
  for (i = 0; i < num; ++i) {
    *minVal = MIN(x[i], *minVal);
    *maxVal = MAX(x[i], *maxVal);
    sum += x[i];
  }
  return sum;
}
/* 関数の呼び出し例。 */
double x[] = { 3, 19, 1, -3, -8, 0, 4 };
double minVal, maxVal, sum;
sum = func(x, 7, &minVal, &maxVal);

下記は標準入力を整数値に変換し、scanf関数の第2引数の参照先であるnにその整数値を出力する例である。scanf関数は書式文字列に応じて、可変長引数に渡された実引数の型が何であるかを判断する。例えば%d書式はintへのポインタが渡されたとみなす。

int n;
int *ptr = &n;
scanf("%d", ptr);

または

int n;
scanf("%d", &n);
  • ポインタへのポインタ

「ポインタへのポインタ」(多重間接参照、ダブルポインタ)を定義することも可能である。動的に確保したメモリへのポインタを関数引数で返却するときや、ポインタ配列を扱うときなどに利用される。

int *ptr;
int **pptr;
pptr = &ptr;
  • トリッキーな例
#include <stdio.h>
/* argvはコマンドライン引数の文字列群へのポインタ配列であり、char *argv[]と宣言することもできる。 */
int main(int argc, char** argv) {
  while (*argv != NULL) printf("%s\n", *argv++);
}

配列argvがポインタとしても扱えることを利用している。しかし、間接演算子"*"とインクリメント演算子"++"のどちらの優先度が高いのかを知らないと、このような記述を理解することはできない。したがって、保守作業の際にバグを誘発しやすいため、以下のように記述したほうがよいとする主張もある。

while (*argv != NULL) {
  printf("%s\n", *argv);
  argv++;
}

関数ポインタ編集

上述の通り、C言語では関数を指すポインタ (pointer to function / function pointer) を作成することができる。

ポインタ演算編集

記憶域 (メモリ) のアドレス空間は、1次元空間である。たとえば32ビットシステムのアドレス空間は、16進数表記で 0x00000000 から 0xFFFFFFFF (4GiB-1) までの整数値が有効な範囲である。ポインタはこのアドレス空間を抽象化し、メモリ上の任意位置のデータ(オブジェクト)にアクセスするためのデータ型である。なお、プロセスのアドレス空間は物理メモリ上のアドレス(物理アドレス)に直接対応するとは限らない。通例、オペレーティングシステムによって物理メモリは抽象化され、プロセスごとに仮想アドレス空間が割り当てられ、プロセスごとの仮想アドレス空間におけるメモリの読み書き処理はOSによって物理アドレスに対する処理に変換される(メモリマッピング)。

ポインタに対する算術演算は、加減算のみが許可される。ポインタに加減算すると、そのポインタが指すデータ型のサイズに比例したオフセットがアドレスに加減算されることになる。これは配列の添え字演算子が、ポインタの加減算とデリファレンスの糖衣構文であることからも自明である。つまり、ある型Tへのポインタの加減算は、メモリ全体をTの配列とみなして、インデックスを増減していることに他ならない。

int* p = NULL;
printf("Size of int = %d\n", (int)sizeof(int));
printf("%p\n", p);
p++; /* sizeof(int) * 1 だけアドレスが加算される。 */
printf("%p\n", p);
p += 10; /* sizeof(int) * 10 だけアドレスが加算される。 */
printf("%p\n", p);
p--; /* sizeof(int) * 1 だけアドレスが減算される。 */
printf("%p\n", p);

バイト単位のアドレッシングが必要な場合、char / signed char / unsigned charへのポインタを利用する。これらの型はサイズが1であることが規格で保証されているため、これらの型へのポインタに対する加減算操作はバイト単位のアドレッシングとなる。

なお、汎用ポインタvoid*は型が不明のため、アドレスの加減算を行なうことができないが、GCC拡張の非標準動作ではvoid型のサイズに1を割り当てるため、加減算が可能となっている[3][4]

void* pv = NULL;
pv++; /* C/C++標準規格に準拠した環境ではコンパイルエラーとなる。 */
printf("%p\n", pv);

ポインタ型のサイズは処理系依存であり、通例ターゲットとするプロセッサアーキテクチャのレジスタ幅と同じサイズを持つ。

オフセット計算などでポインタ間の差を得る必要がある場合、<stddef.h>で定義されているptrdiff_t型を用いる。ポインタ(アドレス値)を整数型に代入する必要がある場合、<stdint.h>で定義されているポインタ互換の整数型intptr_tuintptr_tを用いる(C99およびC++11で標準化されている)。なお、C/C++ではintlongなどの組み込み整数型のサイズもまた処理系依存である。移植性を損なうため、ポインタを扱う目的で組み込み整数型を直接使用してはならない。

// C99 の例。
#include <stdio.h>
#include <stddef.h>
#include <stdint.h>
...
int a[10] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };
int* p1 = &a[0]; // または (a + 0)
int* p2 = &a[9]; // または (a + 9)
printf("p1 = %p, p2 = %p\n", p1, p2);
ptrdiff_t difference = p2 - p1;
printf("Difference as pointer = %td\n", difference); // 9
intptr_t i1 = (intptr_t)p1;
intptr_t i2 = (intptr_t)p2;
printf("Difference in bytes = %jd\n", (intmax_t)(i2 - i1)); // sizeof(int) * 9

問題点編集

ポインタには不正な領域を示しうるという問題がある。たとえば、近年[いつ?]セキュリティ上で問題となっているバッファオーバーランの原因の多くは、ポインタ演算のエラーで起こる不正領域の書き換えによるものである。また、「オブジェクトそのものに対する操作」と「オブジェクトの位置に対する操作」が混在することは、プログラマの混乱を招きやすい。このような問題もあって、JavaC#など、C言語よりも新しい後発のプログラミング言語では、言語レベルでのポインタ機能は、排除されるか制限される方向にある。

しかし、プログラマーに直接ポインタ操作を許可していない言語でも、ポインタ概念は存在する。たとえば、配列中にオブジェクトを格納し、それを要素のインデックスで参照すれば、これは「ポインタ概念」を活用していることになる。したがって、配列の要素数を超えた領域をアクセスすれば、エラーが発生する。しかし、配列へのインデックスアクセスを完全に排除してしまうと、その言語の制限が厳しくなり、単純な動作を簡易に記述できる領域を狭めてしまう(言語の表現力が低下する)。このように、ポインタには危険性があるが、プログラミングをするうえでは、非常に強力なテクニックである。また、C言語でマイコンの周辺デバイスを制御する場合、メモリバス上の特定のアドレスにあるレジスタに値を読み書きする必要があるため、必須のテクニックとなる。

一方、関数型言語などの発展により、ポインタの必要性は、今後減少する可能性が考えられる[独自研究?]。また、データベース領域では、SQLのように関係式からデータを導き出し情報の位置を抽象化する概念が古くからあり、こちらもプログラミングパラダイムに影響を与えることが考えられる[独自研究?]

参照編集

C++における参照は、ポインタと同様「変数がメモリ上に置かれている場所」と解される場合もあるが、それよりもむしろ「その変数を参照する(=変数の値を操作したり出来る)権限」と解されることが多い。参照の概念そのものはメモリの概念と切り離して考えることが可能である(実装上はポインタと同じであることも多い)。

C++における参照の例編集

int n = 5;
int& n2 = n; // n2をnへの参照で初期化する

この場合変数n2はnを参照している。n2とnはオブジェクトを共有しているのでn2と呼んでもnと呼んでも同じものを表す。すなわち変数nにエイリアス(別名)n2が付いたことになる。

ポインタは未初期化の状態や、何も参照していない状態(ヌルポインタ)が許可されるが、C++における参照は必ず初期化が必要となり、何も参照していない状態は許可されない。ただし、ダングリングポインタと同様、破棄された領域への参照は不正となる。

int& foo() {
    int a = 0;
    return a; // 不正。制御が関数呼び出し元に戻った時点で a は破棄されている。
}

脚注編集

関連項目編集