1
Miniprojet – Programmation GPU 2013/2014 Consignes : Vous devez réaliser ce travail seul. Les exercices doivent être compilables et exécutables sur les machines des salles de TP. Vous devez rendre le 18 avril 2014 au plus tard une archive contenant vos fichiers-sources (pas les exécutables !) et un rapport de 2 pages au format PDF indiquant le principe utilisé dans vos noyaux et les résultats obtenus Utilisez obligatoirement http://filex.unilim.fr/ pour uploader votre archive, puis envoyez le lien obtenu à [email protected] ou à [email protected] (les documents envoyés sous forme de fichiers attachés ne seront pas pris en compte). Vous pouvez consulter divers documents ou sites web, mais pensez à indiquer vos sources dans votre rapport (rappel : l'utilisation du copier-coller depuis un document ou un programme que vous n'avez pas écrit vous-même constitue une fraude et peut conduire à votre expulsion du système universitaire) Exercices : 1. Ecrire sous forme séquentielle un programme qui, à partir d'un vecteur de n entiers aléatoires entre 0 et 255, affiche pour chaque entier sa fréquence d'apparition dans le vecteur. 2. Ecrire un programme OpenCL avec un premier noyau non optimisé qui fonctionne uniquement avec la mémoire globale. 3. Sur le modèle de l'histogramme vu en cours, proposer un découpage en workgroups et une nouvelle version du noyau qui permet de travailler plutôt en mémoire locale. Décrire graphiquement dans votre rapport un exemple d'exécution de ce noyau sur le modèle des schémas présentés en cours. 4. Comparer les performances de ces différents programmes sur des valeurs de n de plus en plus grandes ; tester notamment sur les deux types de cartes GPU présentes en salles de TP, et éventuellement sur votre propre machine (donner les specs de votre système).

sujet-projet-2013-2014

Embed Size (px)

DESCRIPTION

pr

Citation preview

Page 1: sujet-projet-2013-2014

Miniprojet – Programmation GPU2013/2014

Consignes :

• Vous devez réaliser ce travail seul. Les exercices doivent être compilables et exécutables surles machines des salles de TP.

• Vous devez rendre le 18 avril 2014 au plus tard une archive contenant vos fichiers-sources (pas les exécutables !) et un rapport de 2 pages au format PDF indiquant le principe utilisé dans vos noyaux et les résultats obtenus

• Utilisez obligatoirement http://filex.unilim.fr/ pour uploader votre archive, puis envoyez le lien obtenu à [email protected] ou à [email protected] (les documents envoyés sous forme de fichiers attachés ne seront pas pris en compte).

• Vous pouvez consulter divers documents ou sites web, mais pensez à indiquer vos sources dans votre rapport (rappel : l'utilisation du copier-coller depuis un document ou un programme que vous n'avez pas écrit vous-même constitue une fraude et peut conduire à votre expulsion du système universitaire)

Exercices :

1. Ecrire sous forme séquentielle un programme qui, à partir d'un vecteur de n entiers aléatoires entre 0 et 255, affiche pour chaque entier sa fréquence d'apparition dans le vecteur.

2. Ecrire un programme OpenCL avec un premier noyau non optimisé qui fonctionne uniquement avec la mémoire globale.

3. Sur le modèle de l'histogramme vu en cours, proposer un découpage en workgroups et une nouvelle version du noyau qui permet de travailler plutôt en mémoire locale. Décrire graphiquement dans votre rapport un exemple d'exécution de ce noyau sur le modèle des schémas présentés en cours.

4. Comparer les performances de ces différents programmes sur des valeurs de n de plus en plus grandes ; tester notamment sur les deux types de cartes GPU présentes en salles de TP, et éventuellement sur votre propre machine (donner les specs de votre système).