Update README.md
Browse files
README.md
CHANGED
@@ -17,3 +17,7 @@ Transformer_depthだけ変わっているので(多分)Attention層のパラ
|
|
17 |
10層⇒4層となる場合1,2,3,7番目の層が残ります。
|
18 |
|
19 |
※up層の3番目は10層のままですが、コサイン類似度の結果が不可解なものになっていました。とりあえずここは変更されていないと仮定しています。
|
|
|
|
|
|
|
|
|
|
17 |
10層⇒4層となる場合1,2,3,7番目の層が残ります。
|
18 |
|
19 |
※up層の3番目は10層のままですが、コサイン類似度の結果が不可解なものになっていました。とりあえずここは変更されていないと仮定しています。
|
20 |
+
|
21 |
+
|
22 |
+
![image/png](https://cdn-uploads.huggingface.co/production/uploads/630591b9fca1d8d92b81bf02/JW84u7ZixzG5l_CyXiNqx.png)
|
23 |
+
![image/png](https://cdn-uploads.huggingface.co/production/uploads/630591b9fca1d8d92b81bf02/lQz5gXmhMHkj81jAAzcJK.png)
|