ちょっと、再確認…
llama2.cはC言語でコーディングされたもの、llama.cppはC++でコーディングされたものです。
GGML/GGUFはGeorgi Gerganovさんによって開発されたML(Machine Leaning)系のC++実装です。 GGはGeorgi Gerganovさんのイニシャルです。
参考URLはつぎです。
https://github.com/ggerganov/ggml
GGMLの実装はつぎのllama.cppにあたると言ってよいのでしょう。
https://github.com/ggerganov/llama.cpp
GGUFはGGMLから引き継がれたモデルの形式です。
本家、ドキュメントはつぎのURLです。
https://github.com/ggerganov/ggml/blob/master/docs/gguf.md
GGUFのフォーマットについてはHuggingFaceのつぎのURLが見やすいかも。
https://huggingface.co/docs/hub/gguf
こちらはAndrej Karpathyさんによって開発されたLlama2のC言語実装です。