vendredi 1 février 2013

Système d'exploitation - Chapitre 1


Chapitre 1                             GENERALITES


      Les logiciels peuvent être classés en deux catégories :
               - les programmes d'application des utilisateurs
               - les programmes système qui permettent le fonctionnement de l'ordinateur. Parmi ceux-ci, le système d'exploitation (SE dans la suite).

      Le SE soustrait le matériel au regard du programmeur et offre une présentation agréable des fichiers. Un SE a ainsi deux objectifs principaux :

               - présentation :  Il propose à l'utilisateur une abstraction plus simple et plus agréable que le matériel : une machine virtuelle

               - gestion : il ordonne et contrôle l'allocation des processeurs, des mémoires, des icônes et fenêtres, des périphériques, des réseaux entre les programmes qui les utilisent. Il assiste les programmes utilisateurs. Il protège les utilisateurs dans le cas d'usage partagé.


1. HISTORIQUE

      Les premiers ordinateurs étaient mis à la disposition d'un programmeur selon un calendrier de réservation : un usager avec un travail unique utilisait seul la machine à un moment donné. Puis vint l'époque du traitement par lots (batch) : enchaînement, sous le contrôle d'un moniteur, d'une suite de travaux avec leurs données, confiés à l'équipe d'exploitation de la machine (inconvénient : temps d'attente des résultats pour chaque utilisateur).

      Cette pratique a  nécessité trois  innovations :
               - le contrôle des E/S et leur protection pour éviter le blocage d'un lot
               - un mécanisme de comptage de temps et de déroutement autoritaire des programmes pour éviter le blocage d'un lot à cause d'une séquence trop longue. Ce furent les première interruptions
               - les premiers langages de commande (JCL) sous forme de cartes à contenu particulier introduites dans le paquet ($JOB, $LOAD, $RUN, etc...)
     
      Historiquement, on peut dire que les SE sont vraiment nés avec les ordinateurs de la 3ème génération (ordinateurs à circuits intégrés apparus après 1965). Le premier SE digne de ce nom est l'OS/360, celui des IBM 360, famille unique de machines compatibles entre elles, de puissances et de configurations différentes. Bien que son extrême complexité (due à l'erreur de couvrir toute la gamme 360) n'ait jamais permis d'en réduire le nombre de bogues, il apportait deux concepts nouveaux :

               - la multiprogrammation : partitionnement de la mémoire permettant au processeur d'accueillir une tâche dans chaque partie et donc d'être utilisé plus efficacement par rapport aux temps d'attente introduits par les périphériques (le processeur est ré-alloué)

               - les E/S tamponnées : adjonction à l'UC d'un processeur autonome capable de gérer en parallèle les E/S ou canal ou unité d'échange. Cela nécessite une politique de partage du bus ou d'autres mécanismes (vol de cycle, DMA).

      Au MIT, F.J. CORBATO et son équipe ont réalisé dès 1962, sur un IBM 7094 modifié, le premier SE expérimental à temps partagé (mode interactif entre plusieurs utilisateurs simultanés), baptisé CTSS. Une version commerciale, nommée MULTICS (MULTiplexed Information and Computing Service), a été ensuite étudiée par cette équipe, les Bell Laboratories et General Electric. Les difficultés ont fait que MULTICS  n'a jamais dépassé le stade expérimental sur une douzaine de sites entre 1965 et 1974. Mais il a permis de définir des concepts théoriques importants pour la suite.

      La technologie à base de  circuits intégrés de la 3ème génération d'ordinateurs a permis l'apparition des mini-ordinateurs et leur diffusion massive (précédant celle des micro-ordinateurs). En 1968, l'un des auteurs de MULTICS, Ken Thompson a effectué une adaptation de MULTICS mono-utilisateur sur un mini-ordinateur PDP-11 de DEC inutilisé dans son Laboratoire des Bell Laboratories. Son collègue Brian Kernighan Ia nomma UNICS (Uniplexed - à l'opposé de Multiplexed - Information and Computer Service), qui devint ensuite UNIX . En 1972, son collègue Dennis Ritchie traduisit UNIX en C, langage qu'il venait de mettre au point avec Kernighan...... L'ère des grands SE avait commencé.

      Avec la grande diffusion des micro-ordinateurs, l'évolution des performances des réseaux de télécommunications, deux  nouvelles catégories de SE sont apparus :

      - les SE en réseaux : ils permettent à partir d'une machine de se connecter sur une machine distante, de transférer des données. Mais chaque machine dispose de son propre SE

      - les SE distribués ou répartis : l'utilisateur ne sait pas où sont physiquement ses données, ni où s'exécute son programme. Le SE gère l'ensemble des machines connectées. Le système informatique apparaît comme un mono-processeur.



2. ELEMENTS  DE  BASE  D'UN  SYSTEME  D'EXPLOITATION

     Les principales fonctions assurées par un SE sont les suivantes :

               - gestion de la mémoire principale et des mémoires secondaires,
               - exécution des E/S à faible débit (terminaux, imprimantes) ou haut débit (disques, bandes),
               - multiprogrammation, temps partagé, parallélisme : interruption, ordonnancement, répartition en mémoire, partage des données
               - lancement des outils du système (compilateurs, environnement utilisateur,...) et des outils pour l'administrateur du système (création de points d'entrée, modification de privilèges,...),
               - lancement des travaux,
               - protection, sécurité ; facturation des services,
               - réseaux

      L'interface entre un SE et les programmes utilisateurs est constituée d'un ensemble d'instructions étendues, spécifiques d'un SE, ou appels système. Généralement, les appels système concernent soit les processus, soit le système de gestion de fichiers (SGF).





      2.1 Les processus

               Un processus est un programme qui s'exécute, ainsi que ses données, sa pile, son compteur ordinal, son pointeur de pile et les autres contenus de registres nécessaires à son exécution.

               Attention : ne pas confondre un processus (aspect dynamique, exécution qui peut être suspendue, puis reprise), avec le texte d'un programme exécutable (aspect statique).

               Les appels système relatifs aux processus permettent généralement d'effectuer au moins les actions suivantes :

               - création d'un processus (fils) par un processus actif (d'où la structure d'arbre de processus gérée par un SE)
               - destruction d'un processus
               - mise en attente,  réveil d'un processus
               - suspension et reprise d'un processus, grâce à l'ordonnanceur de processus (scheduler)
               - demande de mémoire supplémentaire ou restitution de mémoire inutilisée
               - attendre la fin d'un processus fils
               - remplacer son propre code par celui d'un programme différent
                  - échanges de messages avec d'autres processus
               - spécification d'actions à entreprendre en fonction d'événements extérieurs asynchrones
               - modifier la priorité d'un processus

               Dans une entité logique unique, généralement un mot, le SE regroupe des informations-clés sur le fonctionnement du processeur : c'est le mot d'état du processeur (Processor Status Word, PSW). Il comporte généralement :

               - la valeur du compteur ordinal
               - des informations sur les interruptions (masquées ou non)
               - le privilège du processeur (mode maître ou esclave)
               - etc.... (format spécifique à un processeur)
     
               A chaque instant, un processus est caractérisé par son état courant : c'est l'ensemble des informations nécessaires à la poursuite de son exécution (valeur du compteur ordinal, contenu des                   différents registres, informations sur l'utilisation des ressources). A cet effet, à tout processus, on associe un bloc de contrôle de processus (BCP). Il comprend généralement :

               - une copie du PSW au moment de la dernière interruption du processus
               - l'état du processus : prêt à être exécuté, en attente, suspendu, ...
               - des informations sur les ressources utilisées
                         - mémoire principale
                         - temps d'exécution
                         - périphériques d'E/S en attente
                         - files d'attente dans lesquelles le processus est inclus, etc...
               - et toutes les informations nécessaires pour assurer la reprise du processus en cas             d'interruption

               Les BCP sont rangés dans une table en mémoire centrale à cause de leur manipulation fréquente.


      2.2 Les interruptions

               Une interruption est une commutation du mot d'état provoquée par un signal généré par le matériel. Ce signal  est la conséquence d'un événement interne au processus, résultant de son exécution, ou bien extérieur et indépendant de son exécution. Le signal va modifier la valeur d'un indicateur qui est consulté par le SE. Celui-ci est ainsi informé de l'arrivée de l'interruption et de son origine. A chaque cause d'interruption est associé un niveau d'interruption. On distingue au moins 3 niveaux d'interruption :

               - les interruptions externes : panne, intervention de l'opérateur, ....
               - les déroutements qui proviennent d'une situation exceptionnelle ou d'une erreur liée à l'instruction en cours d'exécution (division par 0, débordement, ...)
               -  les appels système

               UNIX admet 6 niveaux d'interruption : interruption horloge, interruption disque, interruption console, interruption d'un autre périphérique, appel système, autre interruption.

               Le chargement d'un nouveau mot d'état provoque l'exécution d'un autre processus, appelé le traitant de l'interruption. Le traitant réalise la sauvegarde du contexte du processus interrompu (compteur ordinal, registres, indicateurs,....). Puis le traitant accomplit les opérations liées à l'interruption concernée et restaure le contexte et  donne un nouveau contenu au mot d'état : c'est l'acquittement de l'interruption.

               Généralement un numéro de priorité est affecté à un niveau d'interruption pour déterminer l'ordre de traitement lorsque plusieurs interruptions sont positionnées.  Il est important de pouvoir retarder, voire annuler la prise en compte d'un signal d'interruption. Les techniques que l'on utilise sont le masquage et le désarmement des niveaux d'interruption :
               - le masquage d'un niveau retarde la prise en compte des interruptions de ce niveau. Pour cela, on positionne un indicateur spécifique dans le mot d'état du processeur. Puisqu'une interruption modifie le mot d'état, on peut masquer les interruptions d'autres niveaux pendant l'exécution du traitant d'un niveau. Lorsque le traitant se termine par un acquittement, on peut alors démasquer des niveaux qui avaient été précédemment masqués. Les interruptions intervenues pendant l'exécution du traitant peuvent alors être prises en compte

               - le désarmement d'un niveau permet de supprimer la prise en compte de ce niveau par action sur le mot d'état. Pour réactiver la prise en compte, on réarme le niveau. Il est évident qu'un déroutement ne peut être masqué; il peut toutefois être désarmé.
     

      2.3  Les ressources

               On appelle ressource  tout ce qui est nécessaire à l'avancement d'un processus (continuation       ou progression de l'exécution) : processeur, mémoire, périphérique, bus, réseau, compilateur, fichier, message d'un autre processus, etc... Un défaut de ressource peut provoquer la mise en attente d'un processus.

               Un processus demande au SE l'accès à une ressource. Certaines demandes sont implicites ou     permanentes (la ressource processeur).  Le SE alloue une ressource à un processus. Une fois une ressource allouée, le processus a  le droit de l'utiliser jusqu'à ce qu'il libère la ressource ou jusqu'à ce que le SE reprenne la ressource (on parle en ce cas de ressource préemptible, de préemption).

               On dit qu'une ressource est en mode d'accès exclusif si elle ne peut être allouée à plus d'un processus à la fois. Sinon, on parle de mode d'accès partagé. Un processus possédant une ressource peut dans certains cas en modifier le mode d'accès.
      Exemple : un disque est une ressource à accès exclusif (un seul accès simultané), une zône mémoire   peut être à accès partagé.

               Le mode d'accès à une ressource dépend largement de ses caractéristiques technologiques. Deux ressources sont dites équivalentes si elles assurent les mêmes fonctions vis à vis du processus demandeur. Les ressources équivalentes sont groupées en classes afin d'en faciliter la gestion par l'ordonnanceur.



      2.4 L'ordonnancement

               On appelle ordonnancement la stratégie d'attribution des ressources aux processus qui en font la demande. Différents critères peuvent être pris en compte :

               - temps moyen d'exécution minimal
               - temps de réponse borné pour les systèmes interactifs
               - taux d'utilisation élevé de l'UC
               - respect de la date d'exécution au plus tard, pour le temps réel, etc...



      2.5 Le système de gestion de fichiers

               Une des fonctions d'un SE est de masquer les spécificités des disques et des autres périphériques d'E/S et d'offrir au programmeur un modèle de manipulation des fichiers agréable et                                              indépendant du matériel utilisé.

               Les appels système permettent de créer des fichiers, de les supprimer, de lire et d'écrire dans un fichier. Il faut également ouvrir un fichier avant de l'utiliser, le fermer ultérieurement. Les fichiers sont regroupés en répertoires arborescents; ils sont accessibles en énonçant leur chemin d'accès (chemin d'accès absolu à partir de la racine ou bien chemin d'accès relatif dans le cadre du répertoire de travail courant).

               Le SE gère également la protection des fichiers.



3. STRUCTURE  D'UN  SYSTEME  D'EXPLOITATION

     On peut distinguer quatre grandes catégories de SE.


      3.1 Les systèmes monolithiques

               Le SE est un ensemble de procédures, chacune pouvant appeler toute autre à tout instant.             Pour effectuer un appel système, on dépose dans un registre les paramètres de l'appel et on exécute une instruction spéciale appelée appel superviseur ou appel noyau. Son exécution commute la machine du mode utilisateur au mode superviseur ou noyau et transfère le contrôle au SE. Le SE analyse les paramètres déposés dans le registre mentionné plus haut et en déduit la procédure à activer pour satisfaire la requête. A la fin de l'exécution de la procédure système, le SE rend le contrôle au programme appelant.

               Généralement, un tel SE est organisé en 3 couches :

               - une procédure principale dans la couche supérieure, qui identifie la procédure de service requise
               - des procédures de service dans la couche inférieure à la précédente qui exécutent les appels système
               - des procédures utilitaires dans la couche basse qui assistent les procédures système. Une procédure utilitaire peut être appelée par plusieurs procédures systèmes.


      3.2 Les systèmes en couches

               On peut généraliser la conception précédente et concevoir un SE composé de plusieurs couches spécialisées, chaque couche ne pouvant être appelée que par des procédures qui lui sont immédiatement inférieures. Citons par exemple le premier SE de cette nature proposé par Dijkstra en 1968  :

               - couche 0 : allocation du processeur par commutation de temps entre les processus, soit  à la       suite d'expiration de délais, soit à la suite d'interruption (multiprogrammation de base du processeur)

               - couche 1 : gestion de la mémoire, allocation d'espace mémoire pour les processus (pagination)

               - couche 2 : communication entre les processus et les terminaux

               - couche 3 : gestion des E/S ( échanges d'information avec des mémoires tampons, c'est à dire avec des périphériques abstraits, dégagés des spécificités matérielles)

               - couche 4 : programmes utilisateurs


      3.3 Les machines virtuelles

               Une des premiers SE à gérer le concept de machine virtuelle a été l'adaptation temps partagé       de l'OS/360 d'IBM, proposé vers 1968 sous le nom de CP/CMS, puis sous le nom de VM/370 en                     1979.

               Le cœur du SE, appelé moniteur de machine virtuelle ou VM/370, s'exécute à même le matériel et fournit à la couche supérieure plusieurs machines virtuelles. Ces machines virtuelles sont des copies conformes de la machine réelle avec ses interruptions, ses modes noyau/utilisateur, etc...

               Chaque machine virtuelle peut exécuter son propre SE. Lorsqu'une machine virtuelle exécute en mode interactif un appel système, l'appel est analysé par le moniteur temps partagé de cette machine, CMS. Toute instruction d'E/S, toute instruction d'accès mémoire est convertie par VM/370 qui les exécute dans sa simulation du matériel. La séparation complète de la multiprogrammation et de la machine étendue rend les éléments du SE plus simples et plus souples. VM/370 a gagné en simplicité en déplaçant une grande partie du code d'un SE dans le moniteur CMS.



      3.4 L'architecture client/serveur

               Cette tendance s'est accentuée dans les SE contemporains en tentant de réduire le SE à un noyau minimal. Une des formes les plus accentuées de cette évolution est l'architecture client/serveur.

               La plupart des fonctionnalités d'un SE sont reportées dans des processus utilisateurs. Pour demander un service comme la lecture d'un bloc de fichier, le processus utilisateur ou processus client envoie une requête à un processus serveur qui effectue le travail et envoie une réponse. Le noyau ne gère que la communication entre les clients et les serveurs. Cependant, le noyau est souvent obligé de gérer certains processus serveurs critiques comme les pilotes de périphériques qui adressent directement le matériel.

               La décomposition du SE en modules très spécialisés le rend facile à modifier. Les serveurs            s'exécutent comme des processus en mode utilisateur et non pas en mode noyau. Comme ils n'accèdent donc pas directement au matériel, une erreur n'affecte que le serveur et pas l'ensemble de la machine.

               En outre, ce modèle est bien adapté aux systèmes distribués. Un client n'a pas besoin de savoir si le SE fait exécuter sa requête par un serveur de sa propre machine ou celui d'une machine distante.

Aucun commentaire:

Enregistrer un commentaire