Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé |
Bienvenue invité ( Connexion | Inscription )
Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé |
26 May 2016, 09:18
Message
#1
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Bonjour,
Depuis 2004 Macbidouille c'est un peu mon groupe de réflexion favori. Je réagis quasi exclusivement dans les news parfois c'est du partage, parfois de l’engueulade mais souvent c'est intéressant. Et si dans l'idéal on aimerait que Macbidouille dure 10 000 ans les vicissitudes du monde réel viendront peut être un jour contrarier cette ambition. J'aimerais donc poser ici la question de la mémoire personnelle numérique dans cette forme d'échange finalement assez récente que sont les forums. Comment réaliser une sauvegarde locale de mes échanges épistolaires afin de conserver cette mémoire même si Macbidouille disparait un jour? On dis souvent si je peux l'afficher c'est que je peut le télécharger. Et dans le cas qui nous occupe c'est sans doute particulièrement vrai. Mais comment? Je vois deux approches possibles:
Ce message a été modifié par Twisell - 26 May 2016, 09:19. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
26 May 2016, 14:07
Message
#2
|
|
Terminaltor Moderating Machine Groupe : Admin Messages : 24 449 Inscrit : 25 Oct 2002 Lieu : Jeumont (59) Membre no 4 319 |
Le 1 n’est pas envisageable ; IPB ne fournit pas ce service, et d’expérience, les hacks ne sont quasiment impossibles à maintenir.
Pour le 2, pas besoin de machine learning, il y a un lien qui fournit la liste des messages d’un utilisateur ( http://forum.macbidouille.com/index.php?ac...r&mid=13063 ), qui permet ensuite d’accéder aux sujets. -------------------- I think therefore I Mac
|
|
|
26 May 2016, 15:11
Message
#3
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
J'avoue la solution 2 c'est un peu partir à la chasse à l'éléphant avec un avion de chasse.
L'idée que j'avais en tête c'était de récupérer un fichier plat intégrable dans une base de données pour pouvoir aussi l’interroger par la suite. Par exemple pour faire des stats marantes sur le vocabulaire utilisé , etc... Bref faire un peu de TextMining avec ses propres écrit. Pour le besoin premier, à savoir sauvegarder ses écrits ta solution (qu'on appellera solution 3) s'impose. Mais à condition de pouvoir l'automatiser un peu. Si ça se trouve une bonne config de DownThemAll suffira amplement Mais y a t'il un paramètre secret qui permet d'afficher plus de 30 messages par page? NB: Je viens de voir que cette interface existait également Télecharger un sujet... Mais comme tu peux le voir sur le sujet des AIPB, il semble également y a voir une limite, même si elle est bien supérieure à 30 posts. PS: Je reprécise juste que je souhaiterais télécharger tous les posts des sujets auxquels j'ai participé, pas uniquement mes posts (et c'est possible de les trouver via la recherche on est bien d'accord ) Ce message a été modifié par Twisell - 26 May 2016, 15:13. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
26 May 2016, 16:04
Message
#4
|
|
Terminaltor Moderating Machine Groupe : Admin Messages : 24 449 Inscrit : 25 Oct 2002 Lieu : Jeumont (59) Membre no 4 319 |
NB: Je viens de voir que cette interface existait également Télecharger un sujet... Mais comme tu peux le voir sur le sujet des AIPB, il semble également y a voir une limite, même si elle est bien supérieure à 30 posts. Semble limité à 300 messages (10 pages) -------------------- I think therefore I Mac
|
|
|
26 May 2016, 16:07
Message
#5
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Pour alimenter la discussion, voici une discussion houleuse sur les forums d'IPS:
https://invisionpower.com/forums/topic/4041...media-platform/ Je continuerais de creuser le sujet et je vous tiens au courant -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
26 May 2016, 17:49
Message
#6
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 3 606 Inscrit : 10 Feb 2011 Membre no 164 526 |
Ben... tu peux toujours aspirer le site (faudra pas être pressé).
|
|
|
27 May 2016, 11:25
Message
#7
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Fait chier, je viens de voir que chez import.io ils ont changés leur business model et ne fournissent plus leur app desktop... (Faut dire leur produit desktop était tellement puissant que l'abonnement n'était pas nécessaire)
Et malgré que j'ai encore l'appli desktop, qui est toujours fonctionnelle, elle ne gère pas correctement les cookies, donc pas possible de crawler le site correctement à partir des résultat de recherche (impossible de rechercher sans être connecté). Ils ont visiblement désactivé la fonctionnalité pour utiliser le crawler en mode authentifié... voir leur support EDIT: Je vais chercher du coté de Scrapy/Portia, visiblement c'est une alternative plus OpenSource EDIT2: D'autres pistes... https://www.producthunt.com/tech/portia Mais pff ça me fais braire import.io était de loin la solution la plus aboutie. Je vais essayer une solution en deux étages: 1. Repérer manuellement "à l'ancienne" avec des regexp les liens dans les résultats recherche (13 pages pour mon acompte, c'est jouable). 2. Ressayer import.io sur les url obtenues à l'étape 1. Comme les forums sont publiques, seul la recherche nécessitait le login. Ce message a été modifié par Twisell - 27 May 2016, 12:08. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
27 May 2016, 14:55
Message
#8
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Bon voila un exemple de fichier résultat à partir d'import.io (et un peu configuré)
test1_imporio_macbidouile.csv.zip ( 10.87 Ko ) Nombre de téléchargements : 4 C'est la mise en forme en CSV de la première page du Thread AIPB. Ca reste laborieux, mais je tiens le bon bout. Mais je m'en occuperais plus tard sinon ma copine va me tuer :P Bon Week-End en attendant Ce message a été modifié par Twisell - 27 May 2016, 14:56. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
29 May 2016, 18:27
Message
#9
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Recete proposée (solution 2) Work in progress :
PS: Franchement ne me dites pas que c'est simple, quand j'aurais fini je posterais une petite requête SQL des famille de 15 lignes qui fait tout en une seule opérations. Evidement je ne connait pas le nom des tables IPS alors ce sera au jugé, mais si un dev peut prendre de voir ce que ça vaut ce serais cool... Je continuerais jusqu'au bout de décrire le fonctionnement de la solution 2 pour le principe, mais ce sera tellement franchement pas à la portée de tous, désolé d'avance. Ce message a été modifié par Twisell - 30 May 2016, 09:06. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
30 May 2016, 09:10
Message
#10
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Bon je viens de tester le scrapping sur ma première page de résultat et j'ai deux problème:
Ce message a été modifié par Twisell - 30 May 2016, 09:27. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
6 Jun 2016, 23:44
Message
#11
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Point d'avancement:
-La version actuelle d'import.io ne permet pas un contrôle assez fin des informations collectées -Je pourrais me baser sur la version desktop que j'ai sous le coude mais ce ne serait ni reproductible pour d'autres utilisateurs, ni pérenne, le logiciel n'étant plus distribué Deux options semblent donc possibles: -Écrire un parseur spécifique, pourquoi pas en utilisant Swift pour le fun: J'ai trouvé ce tutoriel dont les sources sont dispo sur Github et qui pourrait m'inspirer : https://grokswift.com/htmlanddownloads/ -Tenter une approche basée sur du SQL avec le soutien de l'équipe Macbidouille: Je ne connait évidemment pas le schéma de la base IP.Board, mai si la structure ressemble plus ou moins à ça: "threads" contient les sujets "post" contient les posts "users" contient le utilisateurs Cette requête devrait marcher avec une table temporaire pour récupérer la liste des sujets, et une seconde requête pour récupérer tout les post Code CREATE TEMPORARY TABLE my_threads AS SELECT distinct posts.threads_id, FROM post JOIN users ON post.user_id=users.id WHERE users.name='Twisell’; SELECT post.thread_id, threads.name, post.number, users.name, post.content FROM post LEFT JOIN my_threads ON post.thread_id=my_threads.threads_id LEFT JOIN users ON post.user_id=users.id LEFT JOIN threads ON post.threads_id=threads.id; Evidement il y aurait un minimum de recherche à faire pour trouver les bon noms de table et de champs. Et concernant la rapidité de la requête il y a sans doute moyen d’améliorer les performances en l'écrivant en fonction des indexes. Encapsuler des sous-requêtes pour forcer les jointures dans un certains ordre pourrait aussi aider, mais sans avoir la main dans le camboui c’est difficile de prévoir. Ce message a été modifié par Twisell - 6 Jun 2016, 23:45. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
10 Jun 2016, 01:20
Message
#12
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 6 580 Inscrit : 20 Mar 2003 Membre no 6 765 |
Je ne suis pas certain de comprendre pourquoi tu veux extraire tous tes messages du forum.
Tu vois un psy en ce moment ? Sinon, à part se tripoter la nouille, je ne vois pas. -------------------- késtananafout' (:
|
|
|
10 Jun 2016, 10:27
Message
#13
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Voila une requête SELECT tout gentille, faite (et testée)pour MySQL qui ne peut rien casser. Si un gentil admin peut l'executer sur la base des forums et m'envoyer le résultat par mail ca me permettrait d'affiner la requête du dessus.
L'idée est d'utiliser les tables de métadonnées de MySQL pour découvrir la structure de la base d'IP.Board. On pourrait au besoin restreindre la requête au schéma d'installation d'IP.Board (ou à son suffixe ça dépend de l'install) dans une clause WHERE. Code SELECT tables.table_schema,tables.table_name,ordinal_position,column_name,data_type FROM information_schema.tables JOIN information_schema.columns ON columns.table_name=tables.table_name AND columns.table_schema=tables.table_schema ORDER BY table_schema,table_name,ordinal_position; PS: Je vais me faire violence, mais je m'abstiendrais de répondre aux interventions non-constructives. Ce message a été modifié par Twisell - 10 Jun 2016, 10:41. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
17 Jun 2016, 13:28
Message
#14
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Point d'info
Le projet est en stand-by pour l'instant, j’attends de voir si la piste SQL est possible. Un grand merci à baron, Schlum et bad_duck pour les échanges en MP qui ne se voient pas mais font avancer le schmilblick -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
12 Jul 2016, 07:03
Message
#15
|
|
Macbidouilleur d'argent ! Groupe : Membres Messages : 600 Inscrit : 26 Jan 2003 Lieu : Houla...Ouf ! C'est loin ! Membre no 5 847 |
Je ne suis pas certain de comprendre pourquoi tu veux extraire tous tes messages du forum. Tu vois un psy en ce moment ? Sinon, à part se tripoter la nouille, je ne vois pas. sans doute pour s'aider à vivre en douceur cette transcendance multidimensionnelle avec la Lumière Vibrale dans l’objectif de se préparer à vivre l’Ascension dans les mondes unifiés au moment opportun avant de rencontrer sa lignée interstellaire... -------------------- Que faire ??? Quoi dire ??? Que penser ???...
|
|
|
25 Jul 2016, 16:37
Message
#16
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 148 Inscrit : 5 Jan 2004 Lieu : Argentoratum Membre no 13 063 |
Reprise lente du projet ce WE dernier:
PS: Dans la foulée hier soir j'ai commandé le bouquin de Big Nerd Ranch sur Cocoa, il à l'air très bien foutu et totalement adapté à ce dont j'avais besoin. Je ferais donc aussi un retour dessus au fil de mon avancée. Ce message a été modifié par Twisell - 26 Jul 2016, 08:34. -------------------- Télecharger une archive personelle contenant tous les fils de discussions auxquels le membre a participé? (... ou pas malgré la RGPD)[/size]
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité[/size] |
|
|
Nous sommes le : 20th April 2024 - 04:32 |