Local · sans LLM · sans télémétrie

Lintez les règles que personne n’a écrites.

argot apprend la voix de votre dépôt à partir de son propre historique git, puis signale les passages qui ne ressemblent à personne de votre équipe. Aucun modèle. Aucun cloud. Aucun GPU.

Lire la doc → ★ Star sur GitHub

MIT · macOS & Linux · calibré en secondes, scoré en millisecondes

La deuxième question

Le type-checker demande si ça compile. argot demande si c’est le vôtre.

Les linters et type-checkers répondent à « est-ce valide ? ». Ils ne savent pas répondre à « est-ce ainsi que cette équipe écrit ? ». Cela vivait dans la revue de code — jusqu’à ce qu’un LLM puisse l’enterrer sous cent PR propres et bien typées en une après-midi. argot est la couche qui repose la question.

mypystrict — passes
rufflint-clean
argotflags one line

routers/users.py

@router.get("/{user_id}", response_model=UserResponse)
async def get_user(user_id: int, db=Depends(get_db)) -> UserResponse:
    user = db.get(user_id)
    if user is None:
        raise ValueError(f"User {user_id} not found")
    return user

$ argot check

argot check · 1 hunk above threshold (1 foreign)
note: argot is a probabilistic style linter — verify before action.

routers/users.py
  ●  L11-L14   8.21  foreign   · workdir · wrong exception type (bpe)
     ↳ ValueError (0×) — repo raises HTTPException (214×)
  11 │     user = db.get(user_id)
  12 │     if user is None:
  13 │         raise ValueError(f"User {user_id} not found")
  14 │     return user

Décorateurs, Depends, le retour typé — tout est idiomatique en FastAPI. Le seul écart : un ValueError nu là où ce dépôt lève toujours HTTPException. mypy est content. Le linter n’a rien à dire. argot signale la ligne.

Ce qu’il détecte

Techniquement correct. Socialement faux.

argot ne remplace ni ESLint, ni ruff, ni votre type-checker. Il attrape ce qu’ils ne savent pas formuler — les conventions que votre équipe a adoptées par répétition, jamais par écrit.

⌘

Copier-coller de LLM

Un bloc dont le style s’écarte nettement du fichier qui l’entoure — fluide dans la voix moyenne de tous les dépôts publics, pas la vôtre.

↯

Dérive de convention

Gestion d’erreurs, journalisation ou formes de contrôle de flux qui ne correspondent pas au reste du code.

⊘

Paradigme étranger

De la POO à base de classes lâchée dans un code fonctionnel. Un def synchrone sur un chemin async critique. Le mauvais import.

◐

Anomalie stylistique

Du code correct, typé, sans erreur de lint — mais qui ne ressemble à personne de cette équipe.

Comment il reste honnête

Deux tables de fréquence. Aucun réseau de neurones.

argot construit deux distributions de tokens — une depuis votre dépôt, une depuis une référence open-source générique — et signale les passages bien plus probables sous la générique. C’est tout le modèle. Il se calibre sur CPU en secondes et embarque son seuil par dépôt.

Rien ne quitte votre machine

Aucun GPU, aucun cloud, aucune télémétrie. Le modèle, ce sont deux tables de fréquence et un log-ratio max — calibré en secondes, scoré en millisecondes.

Calibré par dépôt

Le seuil est fixé à partir de votre propre code : « normal » veut dire normal ici — pas la moyenne de tous les dépôts publics d’un modèle.

Conscient du langage, pas verrouillé

Un tokenizer tree-sitter analyse les passages partiels et invalides. Python et TypeScript d’emblée ; les monorepos mixtes ont un seuil par langage.

Des preuves, pas des impressions

Chaque signalement nomme les tokens qui ont porté le score, leur fréquence dans votre dépôt, et le vocabulaire habituel ici à la place.

Pourquoi argot

Se lit comme un linter. Pense comme un relecteur.

S’intègre à la CI

argot check tourne à chaque commit, groupe les hits par fichier et sort en non-zéro dès qu’un passage s’écarte. Câblez-le comme ESLint.

Incrémental, pas une réécriture

Pointez-le sur un dépôt, lancez extract → fit une fois, puis check à l’infini. Aucune annotation, aucune config pour démarrer.

Preuves par passage

Chaque hit montre les tokens fautifs et leur attestation — startedAt (0×) vs use (88×) — et le vocabulaire habituel du dépôt à la place.

Une sévérité réglable

unusual · suspicious · foreign, relatifs au seuil calibré. Filtrez le bruit avec --min-severity.

Calibration par langage

Un monorepo Python + TypeScript reçoit un seuil par langage, dispatché par extension. Aucune distribution n’écrase l’autre.

Honnête sur lui-même

Des benchmarks publics, un journal de recherche de 35 docs, et un avertissement linter probabiliste imprimé à chaque run. Vérifiez avant d’agir.

Ajoutez la couche qui manque à votre CI.

argot est MIT et en alpha. Calibrez-le sur votre dépôt en deux minutes, puis voyez ce qu’il signale.

Commencer → Voir sur GitHub