Image numérique et netteté apparente : du « non quantifiable »
Le raisonnement est simple : tout capteur numérique atteint sa résolution optique maximale lorsqu’un « point sombre » de l’objet correspond sur l’image formée (par l’objectif) à la largeur d’un pixel (sur le capteur) dont il est séparé par un pixel représentant virtuellement un « point clair ». Ce qui signifie qu’il faut deux pixels adjacents pour capturer le plus petit détail d’une scène (ou une paire de lignes dans le cas d’une mire). La résolution optique d’un capteur est égale à l’inverse de la moitié du "pas" (p) de ses pixels, soit 1 mm/2p = 1000 µm/2p = 500 µm/p. La résolution globale d’une image se déduit ainsi de la résolution "purement" optique du capteur (en nombre de cycles ou paire de lignes par millimètre : cy/mm), de la fonction de transfert de modulation (FTM) qui mesure le contraste (en %) résultant du transfert des modulations de l’image formée par l’objectif sur le capteur et du facteur de grandissement de l’image.
Le pouvoir séparateur d’un œil normal étant de 1 minutes d’arc environ en luminance, soit 0,0003 radian, il distingue à la distance minimale de vision distincte (250 mm) une paire de lignes de 250x(0,0003x2) = 0,15 mm. Cela correspond à une définition de 1/0,15 = 6,66 cy/mm (ou, en paire de lignes par pouce : 6,66x25,4 = 169,3 lpi).
Remarque sur la sensibilité de l’œil aux couleurs : il faut aussi compter sur le fait que le pouvoir séparateur de l’œil est bien plus faible en chrominance qu’en luminance (0,0012 radian entre le rouge et de le vert ; 0,002 radian entre le rouge et le bleu et 0,0025 radian entre le vert et le bleu). La résolution maximale de l’œil est donc dans le meilleur des cas, soit entre le rouge et le vert, de 0,0012/0,0003 = 4 fois plus faible qu’en luminance. C’est à cause de cette mauvaise résolution de l’œil dans la perception des couleurs qu’il a été possible par exemple d’utiliser un filtre mosaïque de séparation trichrome devant le capteur CCD d’une caméra vidéo ou d’un appareil photo numérique. Ce filtre mobilise ainsi 4 pixels pour chaque couleur permettant de restituer l’espace colorimétrique de l’œil, alors qu’en luminance chaque pixel joue son rôle quant à la résolution de l’image finale.
La comparaison visuelle des résultats obtenus à partir de différents systèmes implique que les épreuves finales soient toutes de même format. Si on décide qu’elles soient toutes agrandies par exemple à 297 mm de long (soir la longueur du format DIN-A4), cela veut dire qu’un original au format 24 x 36 mm sera agrandi 297/36 = 8,25 fois et l’image prise avec un appareil numérique à capteur 2/3’’ par exemple (de dimensions utiles 8,8 x 6,6 mm, soit une diagonale de 11 mm) sera agrandie 297/8,8 = 33,75 fois.
Inversement, l’image formée sur un capteur 24 x 36 mm qui, après avoir été agrandie à 297 mm de long atteint la définition prédéterminée de 6,66 cy/mm, doit offrir une résolution de 6,66x8,25 = 55 cy/mm environ. Dans le cas du capteur au format 2/3’’, le calcul montre que sa résolution devrait être de 6,66x33,75 = 225 cy/mm environ. C’est une valeur que ce capteur ne pourra jamais atteindre car il faudrait que la taille des photosites du capteur atteigne des dimensions de 2,2 µm. Or, la taille réelle des photosites est de 3,4 µm de côté et la résolution optique du capteur est donc de 500/3,4 = 147 cy/mm. Une image de 297 mm de longueur aura donc une résolution de 147/33,75 = 4,35 cy/mm (ou 110,5 lpi). Ce résultat bien qu’inférieur à 169,3 lpi est une résolution plus que suffisante pour la photographie courante car elle confère à un tirage de format DIN-A4 une excellente sensation de « netteté ».
Remarque sur le format d’image : au cours de son histoire, la photographie a principalement utilisé, soit la famille des formats de rapport 4:3 (comme le 4,5 x 6, le 9 x 12, le 18 x 24 cm, etc.), soit le rectangle plus allongé de rapport 3:2 (tel le 6 x 9 cm et surtout le 24 x 36 mm). Par la force des choses, le rapport 3:2 du cliché 24 x 36 mm est une sorte de standard. Dans les domaines de l’imprimerie et de la bureautique, on utilise les formats de papier conformes à la norme « DIN-A4 », dont les deux côtés sont au rapport √2:1. Son adoption étant justifiée par le fait que couper une feuille A4 par le milieu de la largeur donne, sans perte, deux feuilles A5, tandis que deux feuilles A4 accolées par leur longueur donnent une feuille de format A3, et ainsi de suite. Les premiers capteurs CCD ayant été créés pour les caméras vidéo, on a évidemment choisi de leur conférer une cible au rapport 4:3 de l’écran téléviseur standard, de sorte que les appareils photo numériques courants produisent normalement des images au ratio 4:3. Or, le format 4:3 n’est pas homothétique ni du format DIN-A du papier d’impression, ni du format photographique le plus prisé (3:2)…
En assimilant un objectif à un « système de transmission des signaux optiques » (à la manière dont une chaîne audio transmet des signaux électriques), on peut déterminer avec quelle fidélité les signaux optiques sont transmis : il suffit de savoir mesurer la réponse en fréquence de la chaîne optoélectronique. En optique, l’équivalent de la fréquence temporelle d’un son, par exemple, est la fréquence spatiale (la résolution optique en paire de lignes par mm ou de cycles par mm), laquelle indique combien de cycles d’un signal d’une certaine amplitude sont contenus dans 1 mm d’image. La fonction de transfert de modulation (FTM) est donc fondée sur le fait, dans une image, le degré de lisibilité des plus fins détails n’est pas seulement fonction de la résolution optique, mais également du contraste restitué entre les lignes claires et les lignes sombres de la mire. Avec cette méthode de test, rien de doit s’interposer entre la « mire » source et l’image de cette mire formée par l’objectif. La FTM exprime le rapport contraste image / contraste objet (en %) en fonction de la résolution optique définie (en cy/mm). On représente alors graphiquement l’évolution de la FTM en fonction de la résolution optique. Entre un dispositif optique de bonne résolution et de mauvais contraste, et un autre dispositif de mauvaise résolution et de bon contraste, la majorité des observateurs jugera comme « meilleure » l’image produite par ce deuxième dispositif…

Courbes FTM de trois objectifs
A. Bonne résolution, bon contraste. B. Mauvaise résolution, excellent contraste. C. Bonne résolution, mauvais contraste.
Nous le voyons, il serait préférable de parler de « netteté apparente » de l’image et non de résolution ou de définition. La netteté apparente est la résultante globale, non quantifiable, de très nombreux facteurs : d’une part les paramètres mesurables que sont la résolution optique et la fonction de transfert de modulation ; d’autre part, la réponse neurophysiologique de l’observateur dans des conditions infiniment variables (acuité visuelle, distance d’observation, niveau d’éclairement, métamérisme du support, etc.). A tout cela, s’ajoutent les traitements numériques voulus ou subis entre la prise de vue et la restitution sur le support (contraste local, filtres d’accentuation, taux de compression, rapport signal sur bruit, etc.).