input attention seems using wrong projection matrix

```python
        if not share_query_proj:
            # giving each query vector different projection matrix (one-to-one)
            self.query = GroupLinearLayer(
                hidden_size, kdim * num_heads, num_hidden)
        else:
            # giving each query vector different projection matrix (one-to-one)
            self.query = SharedGroupLinearLayer(
                hidden_size, kdim * num_heads, num_hidden)
            # all query share the same projection *proj*
```
SharedGroupLinearLayer is not what's intended. 

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

input attention seems using wrong projection matrix #11

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

input attention seems using wrong projection matrix #11

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions